Apple недавно обнародовала несколько моделей больших языков (LLM) с открытым исходным кодом, способных работать локально, а не полагаться на облачные серверы. Эти модели, получившие название OpenELM (эффективные языковые модели с открытым исходным кодом), доступны на Hugging Face Hub, платформе, предназначенной для обмена кодами искусственного интеллекта.
Согласно информации, представленной в официальном документе (который вы можете найти в формате PDF), всего существует восемь моделей OpenELM. Четыре из этих моделей изначально были обучены с использованием библиотеки CoreNet, а остальные четыре модели были доработаны на основе инструкций. Apple использует послойный подход к масштабированию для повышения точности и эффективности.
Apple поделилась кодом, записями обучения и различными итерациями модели, а не только готовым продуктом для проекта искусственного интеллекта на естественном языке, с целью, чтобы эта прозрачность могла ускорить прогресс и способствовать «надежным выводам» в этой области.
OpenELM — это усовершенствованная языковая модель с открытым исходным кодом, отличающаяся эффективностью на уровне слоев. Используя стратегический метод масштабирования для каждого уровня модели трансформатора, OpenELM достигает превосходной точности. Например, при примерно одном миллиарде параметров OpenELM превосходит OLMo на 2,36 %, используя лишь половину необходимого количества токенов предварительного обучения.
Вместо того, чтобы просто предлагать веса моделей и программное обеспечение для вывода, как раньше, и проводить частное обучение на нераскрытых наборах данных, наша новая версия оснащена полной системой для обучения и оценки языковой модели на общедоступных наборах данных. Этот пакет включает в себя записи тренировок, различные контрольные точки и настройки предварительной подготовки.
Apple объявляет о распространении моделей OpenELM для стимулирования и расширения исследований в открытом сообществе с использованием передовых языковых моделей. Сделав эти модели общедоступными, исследователи смогут изучить потенциальные риски, данные и предвзятости. Разработчики и предприятия имеют возможность напрямую использовать модели или настраивать их в соответствии со своими потребностями.
Открытый обмен информацией теперь имеет решающее значение для Apple, чтобы привлечь элитных инженеров, ученых и специалистов. Такой подход позволяет получить доступ к результатам исследований, которые могли быть скрыты в соответствии с предыдущими правилами конфиденциальности Apple.
Apple пока не внедряла подобные функции искусственного интеллекта в свои гаджеты. Однако есть ожидания, что iOS 18 будет оснащена несколькими новыми возможностями искусственного интеллекта. Более того, ходят слухи, что Apple намерена использовать свои обширные языковые модели на самих устройствах для повышения конфиденциальности.
Смотрите также
- Рецензия на фильм «Триггерное предупреждение» (2024) – Внимание: этот фильм Netflix может вас усыпить.
- Новые грибы, вызывающие стригущий лишай, распространяются половым путем, и их становится все труднее уничтожить
- Продлили ли «Антрацит» на 2 сезон? Вот что мы знаем:
- Обзор Pitaka MagEZ Car Mount Pro 2 Qi2: автомобильное зарядное устройство со встроенными ярлыками NFC
- Продлите срок службы вашего iPhone 16 Pro Max с помощью чехла TORRAS Ostand Spin.
- Обзор Ugreen Nexode Qi2 Powerbank 20000 мАч 145 Вт Макс: умный столб с большой мощностью
- Стефан Барецки основан на реальном человеке? | Нацистская гвардия СС изображена в «Татуировке Освенцима»
- Эти 13 советов помогут вам правильно настроить новый Mac
- Обзор второго сезона «Кровь Зевса» – продолжение драматической и занимательной истории из греческих мифов.
- Если ваши воздушные заставки Apple TV перестали работать, вот почему
2024-04-25 01:52