Технологии

Google учит Gemini переводить речь без задержек

Google учит Gemini переводить речь без задержек

Разработчики Google представили аудиомодель Gemini 3.5 Live Translate, способную переводить живую речь на 70 языков в реальном времени. Технология отказывается от пошаговой обработки в пользу непрерывного потока, позволяя нейросети начинать перевод еще до того, как собеседник закончит свою мысль, что практически исключает характерные для таких систем паузы.

Новинка сохраняет оригинальную интонацию и тембр голоса, игнорируя при этом фоновые шумы. Система работает в связке с Google Meet для бизнеса, а рядовым пользователям станет доступна через мобильное приложение Translate на Android и iOS. При использовании наушников процесс выглядит как обычная беседа, где перевод звучит поверх оригинала.

Для владельцев смартфонов на Android предусмотрен «режим прослушивания». Устройство достаточно поднести к уху, как при обычном телефонном звонке, чтобы слышать адаптированный поток через динамик. Постепенное внедрение функции уже началось, охватывая ключевые коммуникационные продукты экосистемы Google.

Поделиться

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!