Microsoft анонсировала выпуск Harrier-OSS-v1 — семейства многоязычных моделей для создания текстовых эмбеддингов. По данным компании, модели обеспечивают высокое качество семантических представлений текста на широком диапазоне языков.
Семейство включает три варианта разного размера: модель с 270 миллионами параметров, модель с 0,6 миллиарда параметров и модель с 27 миллиардами параметров. Каждый вариант предназначен для различных сценариев использования — от мобильных приложений до высоконагруженных систем.
По информации Microsoft, модели Harrier-OSS-v1 достигли лучших результатов на бенчмарке Multilingual MTEB v2. Компания заявляет, что это свидетельствует о превосходстве моделей в задачах многоязычного поиска и классификации текста.
Модели выпущены с открытым исходным кодом, что позволяет разработчикам интегрировать их в собственные приложения. Microsoft подчеркивает, что открытый формат способствует развитию экосистемы многоязычных ИИ-решений.
Аналитики отмечают, что развитие многоязычных моделей остается приоритетом для крупных технологических компаний в условиях глобализации ИИ-приложений. Выпуск Harrier-OSS-v1 позиционируется как конкурентный ответ на аналогичные разработки других компаний в этом сегменте.
Источник: Marktechpost