OpenAI внедряет более естественный расширенный голосовой режим для ChatGPT

OpenAI внедряет более естественный расширенный голосовой режим для ChatGPT

Как технический энтузиаст с большим интересом к искусственному интеллекту, я должен сказать, что недавние достижения OpenAI вызвали у меня одновременно восторг и легкое удивление. Внедрение расширенного голосового режима в ChatGPT — это значительный шаг на пути к более естественному интерактивному общению с моделями искусственного интеллекта.


Сегодня OpenAI объявила о начале выпуска функции расширенного голосового разговора для ограниченной группы платных пользователей ChatGPT, что позволит им экспериментировать с более реалистичными и мгновенными диалогами.

Модернизированная голосовая функция в ChatGPT обеспечивает немедленные ответы, которые можно вставлять в середине разговора, а также способна обнаруживать и отвечать на юмор, иронию и другие нюансы. В отличие от текущей версии голоса ChatGPT, улучшенной модели не нужно переводить вашу речь в текст, а затем обратно, что обеспечивает более быстрое и плавное взаимодействие.

Еще в мае OpenAI представила свой расширенный голосовой режим с искусственным голосом по имени Sky, который поразительно напоминал голос Скарлетт Йоханссон. Однако Йоханссон не дала согласия на создание и использование этого голоса. В ответ она выступила с заявлением, в котором выразила удивление, гнев и недоверие, когда узнала, что генеральный директор OpenAI Сэм Альтман хотел, чтобы она стала голосом ChatGPT, но получил отказ. Йоханссон почувствовала, что голос искусственного интеллекта, созданный Альтманом, очень похож на ее собственный голос. Первоначально OpenAI утверждала, что Скай не собиралась подражать Йоханссон, но это было снято после того, как она сохранила юридическое представительство.

С момента демонстрации расширенного голосового режима OpenAI сосредоточила усилия на повышении безопасности и качества голосового взаимодействия. Этот режим предлагает четыре предустановленных голоса и предназначен для ограничения ответов, отличающихся от этих голосов, что позволяет избежать любой имитации речи знаменитостей. Чтобы еще больше обеспечить безопасное использование, OpenAI установила барьеры против запросов на вредоносный контент или контент, защищенный авторским правом. Первоначальные испытания помогут точно настроить эту функцию перед более широким выпуском.

Лица, получившие разрешение на использование расширенного голосового режима, вскоре получат инструкции по электронной почте, поскольку OpenAI стремится постепенно привлечь больше пользователей к этой функции. К осени все участники Plus получат право использовать расширенный голосовой режим.

Смотрите также

2024-07-31 03:00