Google выпустила семейство легких современных ИИ-моделей с открытым исходным кодом под названием Gemma в прошлую среду, 21 февраля. Два варианта Gemma, Gemma 2B и Gemma 7B, теперь доступны для разработчиков и исследователей. Компания заявила, что использовала те же технологии и исследования для Gemma, что и для создания моделей Gemini AI.
Интересно, что модель Gemini 1.5 была представлена на прошлой неделе. Эти меньшие языковые модели могут использоваться для создания инструментов ИИ, ориентированных на конкретные задачи, и компания разрешает ответственное коммерческое использование и распространение.
Объявление было сделано главой Google Сундаром Пичаем в сообщении на X (ранее известной как Twitter). Он сказал: «Показав отличные результаты в рамках оценочных испытаний по пониманию языка и рассуждениям, Gemma доступна по всему миру начиная с сегодняшнего дня в двух размерах (2B и 7B), поддерживает широкий спектр инструментов и систем, и работает на ноутбуке разработчика, рабочей станции или GoogleCloud.»
ИИ-модель представлена в двух размерах:
- Gemma 2B состоит из нейронной сети с 2 млрд параметров,
- Gemma 7B включает порядка 7 млрд параметров.
Компания также создала страницу для разработчиков, посвященную ИИ- модели, где можно найти ссылки на быстрый старт и примеры кода на ее странице моделей Kaggle, быстро развернуть инструменты ИИ через Vertex AI (платформа Google для разработчиков по созданию инструментов ИИ/ML), или поиграть с моделью и привязать ее к отдельному домену с использованием Collab (это потребует Keras 3.0).
Осветив некоторые особенности ИИ-моделей Gemma, Google отметил, что оба варианта предварительно обучены и настроены. Они интегрированы с популярными репозиториями данных, такими как Hugging Face, MaxText, NVIDIA NeMo и TensorRT-LLM. Языковые модели могут работать на ноутбуках, рабочих станциях или Google Cloud через Vertex AI и Google Kubernetes Engine (GKE). Компания также выпустила новый Toolkit для генеративного ИИ, чтобы помочь разработчикам создавать безопасные и ответственные инструменты ИИ.
Согласно отчетам, опубликованным Google, Gemma превзошла языковую модель Llama-2 Meta в нескольких крупных оценочных испытаниях, таких как Massive Multitask Language Understanding (MMLU), HumanEval, HellaSwag и BIG-Bench Hard (BBH). Следует отметить, что Meta уже начала работать над Llama-3, согласно различным отчетам.
Выпуск открытых меньших языковых моделей для разработчиков и исследователей стал трендом в пространстве ИИ. Stability , Meta, MosaicML, и даже Google с его моделями Flan-T5 уже существуют в открытом доступе. С одной стороны, это способствует развитию экосистемы, так как все разработчики и специалисты по данным, которые не работают с компаниями по ИИ, могут опробовать эту технологию и создать уникальные инструменты.
С другой стороны, это также выгодно для компаний, поскольку чаще всего сами фирмы предлагают платформы развертывания, за которые взимается плата за подписку. Кроме того, разработчиками часто выявляются недостатки в обучающих данных или алгоритме, которые могли остаться незамеченными до выпуска, что позволяет предприятиям улучшить свои модели.
Хотите сделать НОВЫЙ САЙТ или МОБИЛЬНОЕ ПРИЛОЖЕНИЕ, чтобы привлечь больше клиентов, или переделать существующий проект с учетом передовых технологий по обеспечению безопасности? Напишите нам https://new-artismedia-client.bitrix24site.ru/ , и мы поможем!