Современные беспилотники отлично справляются с привычным трафиком, но пасуют перед хаосом. Новый бенчмарк Fail2Drive показал, что системы автономного вождения теряют управление, когда на пути внезапно возникает слон или детская горка. Исследователи из Университета Тюбингена доказали: алгоритмы пока не готовы к реальной жизни.
Команда под руководством Андреаса Гайгера из Университета Тюбингена представила бенчмарк Fail2Drive. Разработчики интегрировали его в популярный симулятор CARLA, чтобы проверить, как алгоритмы реагируют на ситуации «вне распределения». Проблема современных методов оценки заключается в том, что тестовые сценарии слишком похожи на те, на которых нейросети обучались изначально. В итоге машины демонстрируют не реальную устойчивость к хаосу, а банальное «запоминание» типовых перекрестков и разметки.В рамках Fail2Drive беспилотники сталкиваются с абсурдными на первый взгляд препятствиями. В одном сценарии дорогу переходит слон, в другом — прямо на проезжей части стоит массивная детская горка. Особое внимание уделили визуальным ловушкам, например, стене с рисунком уходящей вдаль трассы. Реальные системы уже попадались на такие уловки, принимая качественные граффити за свободный путь. Результаты испытаний оказались отрезвляющими: средний показатель успешности автономных моделей в этих условиях упал на 22,8%, что вскрыло глубокие проблемы в логике работы ИИ.
Авторы работы подчеркивают, что их цель — не создание игровых ситуаций, а поиск фундаментальных уязвимостей в архитектуре нейросетей. Даже если встреча со слоном в центре города кажется маловероятной, способность системы адекватно реагировать на любой нестандартный объект определяет итоговую безопасность пассажиров. Без умения обрабатывать редкие и непредсказуемые события беспилотный транспорт не сможет полноценно выйти на дороги общего пользования, где риск столкновения с аномалией сохраняется всегда.
Комментарии (0)
Пока нет комментариев. Будьте первым!