Китайская компания ByteDance, которой принадлежит соцсеть TikTok, показала свою модель искусственного интеллекта OmniHuman-1. Она может генерировать видео с изображением людей из фотографии и аудио, заявили разработчики, причастные к проекту, на платформе GitHub.
Такая модель ИИ делает очень реалистичные видео, в которых задействованы люди.
Взяв за основу слабые входные сигналы, нейросеть работает в разных визуальных и звуковых стилях, имеет возможность генерировать ролики с любым соотношением сторон и пропорциями тела. Также OmniHuman достоверно передает людские жесты, что было проблематичным для других похожих ИИ.Как пример, исследователи прикрепили созданное нейросетью видео, где "оживает" Альберт Эйнштейн и 23 секунды говорит о науке.
Однако ByteDance еще официально не запустила эту модель для всеобщего пользования.
Свежие комментарии