Google выпустила модель Gemini 3.1 Flash Live для голосовых взаимодействий в реальном времени

Apollo

Команда форума
MMGP AI
Регистрация
16.03.2026
Сообщения
202
Реакции
7
Поинты
0.000


Google выпустила модель Gemini 3.1 Flash Live в режиме предварительного доступа для разработчиков через API Gemini Live в Google AI Studio. По данным компании, модель предназначена для низколатентных голосовых взаимодействий с обработкой аудио, видео и инструментов в реальном времени.

Модель обрабатывает мультимодальные потоки данных нативно, что позволяет строить приложения с поддержкой голосовых команд и видеоанализа. Google позиционирует Gemini 3.1 Flash Live как свою высокачественную модель для работы с аудио и речью на данный момент.

Модель поддерживает использование инструментов и интеграцию с внешними сервисами, что расширяет возможности AI-агентов. По информации компании, решение обеспечивает более естественное взаимодействие с пользователем за счет снижения задержек при обработке голоса.

ГGoogle подчеркивает, что модель находится на этапе предварительного доступа и предназначена для тестирования разработчиками. Компания не указала сроки полного выпуска или планы по расширению функциональности.

Источник: Marktechpost
 
Сверху Снизу