Google I/O: Project Astra делает то, чего не делает Rabbit R1

Google I/O: Project Astra делает то, чего не делает Rabbit R1

Как технически подкованный человек, который всегда находится в поиске последних инноваций, я с большим интересом слежу за разработками в области распознавания голоса и технологий транскрипции искусственного интеллекта. Вчера я обсуждал, что новая функция Apple для голосовых заметок на iPhone на базе искусственного интеллекта является серьезным конкурентом обещанных возможностей транскрипции и обобщения Rabbit R1 позже в этом году. Но сегодня на Google I/O технологический гигант поднялся на ступеньку выше, представив свой мультимодальный ИИ-агент Project Astra.


Вчера я обсуждал последнюю инновацию Apple в области голосовых заметок, которая включает транскрипцию и обобщение на основе искусственного интеллекта. Эта функция отражает обещание, данное Rabbit относительно возможностей модели R1, выпуск которой запланирован на конец этого года. Это означает, что на один стимул покупать устройство R1 у Rabbit меньше.

Сегодня на мероприятии Google I/O компания Google представила Project Astra — усовершенствованный агент искусственного интеллекта. Этот инновационный помощник, способный обрабатывать аудио, изображения и видео, призван помочь вам, предоставляя точные ответы на ваши запросы и даже дополнительные вопросы в режиме реального времени. Ключевой момент продажи? Быстрое время отклика, переводящее взаимодействие на разговорный уровень.

Как любопытный геймер, я был очарован основной презентацией, в которой женщина продемонстрировала расширенные возможности своего телефона Google. Она прогулялась по своему офису, останавливаясь, чтобы узнать у своего устройства конкретный компонент одного из динамиков. Быстро отреагировав, он определил, что это твитер. Заинтригованная, она продолжила проверять его возможности, прося его вспомнить, где она в последний раз оставила свои потерянные очки. Впечатляет то, что телефон указывал точное местоположение, от чего у меня отвисла челюсть.

В ходе своего выступления Google неоднократно подчеркивал функциональность своих новых функций Gemini AI «Просто спроси». Их цель — предоставить всю необходимую информацию, не требуя явных запросов. Инновационным аспектом является функция боковой панели, которая будет доступна в Gmail и Google Docs. Эта функция может сократить длительные разговоры по электронной почте, извлечь важные моменты из часовой презентации или предоставить краткое изложение PDF-документов.

Как страстный геймер и энтузиаст технологий, я был очень впечатлен во время презентации, когда они продемонстрировали, как пользователь боковой панели может попросить извлечь важные данные из квитанций в электронных письмах, полученных за последние 30 дней, и аккуратно упорядочить их в электронной таблице. Основной докладчик подчеркнул, что мы сможем полностью автоматизировать этот процесс, гарантируя, что наши таблицы будут обновляться в режиме реального времени с помощью Gmail. Это одна из самых ожидаемых функций, которую R1 планирует представить к концу 2024 года, и они неоднократно заявляли об этом в своих объявлениях.

«Я уже говорил об этом раньше и повторю еще раз: как только телефоны станут достаточно продвинутыми, чтобы соответствовать возможностям специализированных устройств искусственного интеллекта, эти устройства по сути устареют».

Смотрите также

2024-05-15 00:00