Проект llama.cpp получил обновление с поддержкой обработки аудиоданных. По информации Habr AI, в репозиторий проекта был добавлен pull request, расширяющий функциональность инструмента.
Обновление включает поддержку моделей Gemma 4, которые способны распознавать речь. Эти модели разработаны компанией Google и доступны в репозитории HuggingFace.
llama.cpp — это кроссплатформенный проект для запуска больших языковых моделей на локальных машинах. Добавление функции обработки аудио расширяет возможности инструмента для работы с мультимодальными моделями.
Расширение функциональности позволяет пользователям llama.cpp работать с моделями, которые обрабатывают не только текст, но и речевые данные. Это требует наличия соответствующих вычислительных ресурсов на локальной машине.
Источник: Habr AI
Реклама: 🔥 Хочешь получить Telegram Premium и стать гуру Polymarket? Кликай сюда!