Технологии

Сбер представил первую российскую диффузионную модель GFusion

Классические архитектуры вынуждены переписывать весь ответ целиком, если в процессе генерации обнаруживается ошибка. GFusion работает по принципу графических нейросетей: она дорабатывает текст пошагово, не ограничиваясь строгим движением слева направо. Модель сама определяет, какой фрагмент ответа требует проработки на конкретном этапе, что делает процесс генерации гибким.

Помимо скорости, разработчики выделяют эффективность работы с данными: такие модели способны извлекать больше полезной информации из ограниченных обучающих выборок. Компания уже открыла доступ к исходному коду и инструментам для оптимизации обучения подобных систем. Это первый прецедент в российском секторе генеративного ИИ, когда технология такого уровня масштаба переходит в категорию open source.

Поделиться

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!