Специалисты НИУ ВШЭ адаптировали языковую модель для работы с российской научной терминологией, чтобы снизить зависимость от англоязычных систем. Разработка, уже прошедшая государственную регистрацию, ускоряет обработку текстов в 2,7 раза и требует значительно меньше оперативной памяти, позволяя запускать нейросеть на доступном оборудовании без потери качества интерпретации данных.
Для обучения системы эксперты Института статистических исследований и экономики знаний ВШЭ использовали корпус iFORA-QA. Этот массив данных, собранный вручную 150 специалистами, включает аналитические отчеты и документы в сфере инноваций. В отличие от универсальных моделей, склонных к поверхностным суждениям, этот инструмент глубоко понимает специфику отечественных инженерных и научных текстов, что подтвердила главный аналитик проекта Анастасия Малашина.В ближайших планах разработчиков — превращение модели в полноценную мультиагентную систему. Она получит функции «умного» поиска со ссылками на верифицированные источники, что минимизирует риск генерации ложных фактов, а также модуль для построения графов связей между данными. В будущем нейросеть научится работать с неполными запросами, самостоятельно уточняя детали у пользователя перед подготовкой итогового ответа.

Комментарии (0)
Пока нет комментариев. Будьте первым!