Странные зубы выдают подделку в новейшем видеогенераторе с искусственным интеллектом от Microsoft

На этой неделе исследователи Microsoft представили инновацию искусственного интеллекта под названием VASA-1, способную создавать реалистичные разговорные видео из одного изображения. Инструмент еще не стал общедоступным, но он, безусловно, оставляет след своими расширенными возможностями. Однако при ближайшем рассмотрении зубы оставляют желать лучшего.

Связанный контент

Модель VASA-1 преобразует статичное изображение человеческого лица или искусственное лицо из примеров Microsoft в реалистичное видео путем обработки сопровождающего аудиофайла. Получившееся видео демонстрирует аутентичные выражения лица и плавные движения.

Связанный контент

Выключенный
Английский

Технология VASA-1 от Microsoft действительно замечательна, как показано в одном из следующих видеороликов. Однако есть один аспект, в котором этого не хватает: рендеринг зубов. При внимательном рассмотрении зубов они могут принять несколько мультяшный вид и продемонстрировать легкую анимацию, что кажется неуместным, учитывая гиперреалистичное изображение всего остального.

Выключенный
Английский

При замедлении видео необычные зубы персонажа становятся более отчетливыми, как это демонстрирует гифка от TopMob (немного смущает внимательно разглядывать чью-то внешность, но помните, что в данном случае изображенный человек — всего лишь цифровое творение).

Демонстрация видео Microsoft, представленная ниже, демонстрирует мультяшные черты зубов, несмотря на то, что другие элементы кажутся удивительно реалистичными. Примечательно, что это изображение было получено на основе одиночного статического изображения и слухового сигнала.

Выключенный
Английский

В некоторых видеороликах с участием мужчин зубы по неясным причинам не очень заметны. Возможно, это потому, что мужчины не так широко открывают рты, когда говорят. Однако, если вы обратите пристальное внимание, есть признаки того, что в этих случаях что-то не совсем естественно.

Выключенный
Английский

Исследователи обнаружили один интригующий аспект этой модели: она генерирует видео относительно хорошего качества за короткий промежуток времени, что, как утверждается, является сложной задачей для некоторых других генераторов видео с искусственным интеллектом, таких как Sora от OpenAI. В документе даже упоминается задержка всего 0,17 секунды на настольном ПК с одним графическим процессором NVIDIA RTX 4090.

Такая скорость позволяет мгновенно создавать видеоролики для различных целей, например, в приложениях для перевода в реальном времени.

Новый метод, который мы представляем, не только обеспечивает высочайшее качество видео с аутентичными движениями лица и головы, но также позволяет создавать видеоролики 512×512 в реальном времени с плавной частотой 40 кадров в секунду практически без начальной задержки. Это открывает возможности для настоящего интерактивного опыта с реалистичными аватарами, имитирующими манеру человеческого разговора.

Выключенный
Английский

Исследователи признают потенциальные риски, связанные с этой технологией, возможно, объясняя нежелание Microsoft немедленно обнародовать ее. Тем не менее, они также обнаружили приложения, которые, по их мнению, принесут пользу человечеству.

«Наши исследования и связанные с ними инициативы приносят значительные преимущества, в том числе способствуют обеспечению справедливости в образовании, облегчают общение для тех, кто сталкивается с трудностями, предоставляют дружеское общение или терапевтическую помощь тем, кто в ней нуждается, и многое другое. Мы стремимся создавать ИИ этично, с главной целью повышения благосостояния человечества».

В этом конкретном контексте мы не намерены предоставлять онлайн-демонстрацию, API, продукт, дополнительную информацию или любые связанные элементы до тех пор, пока мы не будем уверены, что технология будет использоваться этично и в соответствии с соответствующими законами и правилами.

Учитывая распространенность мошенничества, связанного с этой технологией, со стороны Microsoft было бы разумно предпринять значительные шаги для минимизации потенциального вреда. Учитывая, что до президентских выборов в США 2024 года осталось всего семь месяцев, а глобальная угроза фашизма сохраняется, умение отличать факты от вымысла в Интернете становится более важным, чем когда-либо. Беспомощность человечества перед лицом фальшивок, созданных искусственным интеллектом, ощутима. Поэтому таким компаниям, как Microsoft, крайне важно принимать превентивные меры, прежде чем дезинформация распространится беспрепятственно.

Смотрите также

2024-04-19 15:15