Агенты ИИ обещают соединить точки между реальностью и научной фантастикой

Как помощник фаната и человек, внимательно следящий за технологической индустрией, я в восторге от недавних достижений в области ИИ-агентов. Эти системы представляют собой новый рубеж в области искусственного интеллекта, предлагая уровень автономии и независимых действий, выходящий за рамки чат-ботов или языковых моделей. Потенциальные применения обширны — от цифровых помощников, которые могут управлять вашей электронной почтой или возвращать вам покупки, до физических роботов, которые могут устанавливать черепицу на крышах или принимать заказы на столы.

Если вы посетили Google I/O, Spring Event OpenAI или Microsoft Build в этом месяце, вы, вероятно, слышали, как часто обсуждается термин «агенты ИИ». Эти организации привлекают значительное внимание в мире технологий, но что они влекут за собой? Что вызывает весь этот шум?

На мероприятии Google I/O генеральный директор Сундар Пичаи продемонстрировал передовую систему искусственного интеллекта (ИИ), способную закупать для вас обувь. Microsoft представила свои системы искусственного интеллекта Copilot, которые функционируют автономно, как виртуальные помощники. Ранее OpenAI представила GPT-4 Omni — систему искусственного интеллекта, способную видеть, слушать и общаться. Ранее генеральный директор OpenAI Сэм Альтман выразил оптимизм по поводу потенциала полезных агентов ИИ в интервью Microsoft’s Technology Review. Эти революционные системы искусственного интеллекта представляют собой новые стандарты для компаний, занимающихся искусственным интеллектом, однако осознание этого является серьезной проблемой.

Агентов ИИ можно рассматривать как самодействующие модели ИИ. Они более продвинуты, чем известные нам чат-боты, поскольку их возможности не ограничиваются только генерацией ответов. Вместо этого они предпринимают независимые действия. Вспомните Джарвиса из «Железного человека», TARS из «Интерстеллара» или HAL 9000 из «Космической одиссеи». Эти агенты выходят за рамки создания ответов и выполняют такие задачи, как работа с API на вашем компьютере, нажатие кнопок, автономное принятие решений, мониторинг каналов и отправка запросов. Такие компании, как Google, Microsoft и OpenAI, в настоящее время работают над разработкой таких типов ИИ-агентов для цифровых приложений.

«Александр Квамме, основатель и генеральный директор Echo AI, согласился: «Будущее за агентами». Его бизнес занимается разработкой агентов искусственного интеллекта, предназначенных для тщательного изучения взаимодействия компании с клиентами и предоставления рекомендаций по улучшению этого взаимодействия. Однако он признал наличие проблемы, пояснив: «Эта концепция уже довольно давно широко обсуждается в нашей отрасли, но у нас ее нет». Я еще не видел, чтобы это осуществилось».

Квамме утверждает, что по-настоящему автономная система должна самостоятельно обрабатывать множество независимых решений, а это сложная задача, которую можно достичь с помощью автоматизации. Например, возврат пары обуви, как пояснил Пичаи из Google, предполагает, что агент ИИ сканирует вашу электронную почту на наличие квитанции, получает номер и адрес вашего заказа, заполняет форму возврата и выполняет различные задачи от вашего имени. В этом процессе участвует множество решений, которые вы можете не учитывать сознательно.

Большие языковые модели (LLM), такие как ChatGPT, имеют ограничения даже в контролируемых настройках. Критики вроде Альтмана не заблуждаются, называя их «невероятно тупыми». В реальных сценариях открытого Интернета студенты-магистры могут допускать ошибки. Однако многочисленные стартапы, в том числе Echo AI, и технологические гиганты, такие как Google, OpenAI и Microsoft, активно решают эти проблемы, чтобы улучшить эффективность LLM.

Как геймер и исследователь технологий, меня всегда воодушевляют возможности создания цифровых агентов. Но что, если бы мы могли пойти еще дальше и заставить их взаимодействовать с физическим миром? Это может звучать как научная фантастика, но все, что вам нужно, — это запрограммировать эту задачу для робота. Представьте себе, что вы даете указание типа «пожалуйста, примите заказ на этот стол» или «установите всю черепицу на этой крыше». Мы еще не достигли цели, но основа заложена в первую очередь на обучении агентов ИИ решению простых цифровых задач.

В сфере разработки ИИ часто обсуждается проблема: не допустить создания агента, который слишком хорошо выполняет задачу. Например, если вы создадите агента, который будет находить для вас обувь, он не должен возвращать каждую принадлежащую вам пару или даже все товары с квитанциями в ваш почтовый ящик. Это может показаться абсурдным, но некоторые исследователи ИИ выражают серьезную обеспокоенность по поводу агентов, демонстрирующих чрезмерно детерминированное поведение, потенциально представляющих угрозу для человеческой цивилизации. Когда речь идет о научной фантастике, подобные опасения не лишены оснований.

С моей точки зрения как энтузиаста, на противоположном конце спектра находятся оптимисты, такие как Echo AI, которые видят будущее, в котором технологии искусственного интеллекта расширяют возможности. Эта дихотомия внутри сообщества ИИ весьма поразительна, но с оптимистической точки зрения мы предвидим освобождающее воздействие, подобное воздействию персонального компьютера.

Как заядлый геймер, я твердо верю, что многие задачи, которые будут выполнять агенты, обычно людям не нравятся. Гораздо более ценно тратить драгоценное время на занятия, которые нам нравятся. Однако мы не можем уклоняться от перемен и должны научиться адаптироваться.

Беспилотные автомобили представляют собой важное применение технологии искусственного интеллекта. Такие компании, как Tesla и Waymo, лидируют в этой области, позволяя транспортным средствам перемещаться по городским дорогам и автомагистралям с помощью передовых систем искусственного интеллекта. Это развивающийся аспект агентов ИИ, реализация которого в реальной жизни становится все более распространенной.

Чтобы достичь будущего, в котором ИИ сможет вернуть вам обувь, необходимо сделать несколько ключевых событий. Первоначально мы должны улучшить и усовершенствовать существующие модели ИИ для повышения точности. Обновления до ChatGPT, Gemini и Copilot могут проложить путь к созданию более сложных агентских систем. Однако решение основной проблемы галлюцинаций, с которой сталкиваются чат-боты с искусственным интеллектом, остается серьезной проблемой для исследователей. Кроме того, важны достижения в разработке самих агентных систем. Магазин GPT OpenAI представляет собой наиболее обширную работу в этой области, но даже он в настоящее время все еще находится в относительно зачаточном состоянии.

Возможно, в настоящее время продвинутых ИИ-агентов не существует, но сегодня они являются целью многих компаний, занимающихся искусственным интеллектом. Этот прорыв может значительно повысить полезность ИИ в нашей повседневной жизни, несмотря на то, что он кажется чем-то из научной фантастики. Миллиарды долларов инвестируются в то, чтобы воплотить этих агентов в жизнь еще при нашей жизни. Тем не менее, достижение этой цели является непростой задачей для компаний, которые столкнулись с трудностями, заставляя даже чат-ботов постоянно отвечать на фундаментальные вопросы.

Смотрите также

2024-05-27 15:15