OpenAI раскрывает голосовые возможности GPT-4 Omni, и они буквально невероятны

OpenAI раскрывает голосовые возможности GPT-4 Omni, и они буквально невероятны

Как опытный геймер и энтузиаст технологий, я поражен последней инновацией OpenAI — GPT-4o. Возможность взаимодействовать с чат-ботом с искусственным интеллектом в режиме реального времени, используя человеческую речь и эмоции, является просто выдающейся. Такое ощущение, что мы наконец вступаем в область научной фантастики, где помощники ИИ не ограничиваются текстовыми сообщениями или заранее запрограммированными ответами.


Во время весеннего обновления OpenAI в Сан-Франциско в понедельник утром я был очень рад стать свидетелем презентации их последнего шедевра — GPT-4 Omni (GPT-4o). С большим волнением технический директор Мира Мурати и ее команда вышли на сцену, чтобы представить это замечательная новая флагманская модель GPT-4o теперь способна вести настоящие устные беседы в режиме реального времени с чат-ботом с искусственным интеллектом, который убедительно имитирует человеческую речь.

«На сцене Мурати рассказал, что GPT-4o обладает интеллектом наравне с GPT-4, но работает быстрее. Наша команда считает, что это нововведение расширяет границы сотрудничества, делая взаимодействие более аутентичным и легким».

GPT-40 мгновенно отвечает на голосовые запросы приятным голосом, напоминающим голос Скарлетт Йоханссон в фильме «Она». Эта технология оживляет фильм, передавая эмоции через речь, временами демонстрируя энтузиазм и даже смех. Кроме того, он распознает эмоции и тона голоса пользователей во время разговоров. Команда OpenAI продемонстрировала взаимодействие с этими чат-ботами с искусственным интеллектом практически в реальном времени, продемонстрировав их способность быстро адаптироваться в случае прерывания.

Хотя слуховые способности GPT-4o заслуживают внимания, Omni выделяется в различных форматах. Раньше ChatGPT обрабатывал текст, визуальные эффекты и аудио, используя отдельные сети искусственного интеллекта. Напротив, GPT-4o — это унифицированная модель, которая управляет всеми тремя типами данных, что приводит к повышению эффективности. Благодаря этому нововведению вы можете отображать математическую задачу через камеру телефона, одновременно разговаривая с моделью устно. OpenAI утверждает, что их последнее предложение сохраняет интеллектуальное мастерство GPT-4 и устанавливает вехи в области многоязычия, обработки звука и возможностей компьютерного зрения.

Как заядлый геймер и страстный пользователь передовых технологий OpenAI, я рад сообщить, что мы собираемся представить следующий уровень нашего чат-бота, GPT-40. После этой потрясающей демонстрации мы выпустим настольное приложение, разработанное специально для пользователей macOS. Те, кто вложил средства в наши премиальные услуги, могут начать пользоваться этой новой функцией уже сегодня! Остальные из нас, пользователи бесплатной версии, в свое время присоединятся к веселью.

Марк Чен и Баррет Зоф из OpenAI продемонстрировали функциональность своей мультимодальной модели искусственного интеллекта, работающей в реальном времени, во время живой демонстрации в понедельник. Взаимодействие между людьми и ИИ было в основном успешным: Чен и Зоф побудили модель изменить направление своих ответов. GPT-4 продемонстрировал впечатляющий набор возможностей: от рассказывания сказок на ночь до помощи в решении математических задач. Время от времени модель сталкивалась с трудностями при понимании намерений пользователя, но ей удавалось изящно преодолеть эти недопонимания.

Как заядлый геймер, погруженный в новейшие технологические достижения, я лично ощутил захватывающие возможности новейшей голосовой модели OpenAI, GPT-4o. Этот инновационный ИИ не только рассказывает истории разными голосами, но и оживляет персонажей посредством выразительного смеха. Человеческое прикосновение на этом не закончилось – в какой-то момент оно даже тепло похвалило меня сердечным «Это так мило с твоей стороны».

Представитель OpenAI в твиттере признал, что они дорабатывают GPT-4o на платформе чат-бота LMSYS Org под псевдонимом «im-also-a-good-gpt2-chatbot». Как некоторые предполагали и намекал Сэм Альтман, эти модели действительно разрабатывались OpenAI. Сотрудник также похвалился, что GPT-4o превзошел других ведущих чат-ботов, таких как GPT-4 Turbo и Claude 3 Opus, в различных тестах.

Представление GPT-4o знаменует собой важную веху в развитии чат-ботов с искусственным интеллектом, превзойдя заметные задержки, которые были обычным явлением в их более ранних версиях. Теперь, когда в нашем распоряжении есть возможности работы в реальном времени, представление об эффективной Siri, улучшенной с помощью GPT-4o, не является чем-то надуманным. Новые чипы вывода Nvidia могут стать движущей силой этих замечательных улучшений, как подчеркнул Мурати во время презентации. Благодаря этой демонстрации OpenAI укрепила свою роль пионера в области инноваций в области искусственного интеллекта, оставив нас заинтригованными истинным потенциалом GPT-4o – будь то аутентичная витрина или тщательно подобранный дисплей.

Смотрите также

2024-05-13 21:30