Технологии

Cerebras запускает триллионную модель Kimi K2.6 на рекордной скорости

Cerebras запускает триллионную модель Kimi K2.6 на рекордной скорости

Технологический прорыв на пластинах Wafer-Scale

Результаты независимого аудита Artificial Analysis подтверждают: запрос объемом 10 000 входных токенов обрабатывается системой Cerebras за 5,6 секунды. Для сравнения, официальный облачный сервис Kimi тратит на аналогичную задачу более 160 секунд. Этот разрыв обусловлен архитектурой процессора Wafer-Scale Engine 3, который исключает сетевые задержки, характерные для кластеров из множества видеокарт. Поскольку все данные размещаются на едином кристалле с 44 гигабайтами сверхбыстрой памяти SRAM, маршрутизация экспертов в модели Kimi K2.6 происходит на аппаратной скорости.

Успех проекта доказывает состоятельность стратегии Cerebras, долгое время находившейся в тени рыночных стереотипов. Обладая капиталом в 95 миллиардов долларов после недавнего IPO, компания переходит от работы с небольшими нейросетями к поддержке полноценных триллионных моделей. Архитектура Mixture-of-Experts позволяет Kimi K2.6 демонстрировать показатели, сопоставимые с GPT-5.4, при этом предлагая бизнесу альтернативу дефицитным мощностям OpenAI и Anthropic.

Сейчас доступ к мощностям ограничен корпоративным сектором и компаниями из списка Fortune 500. В Cerebras не стремятся конкурировать с бюджетными провайдерами, позиционируя себя как высокопроизводительный инструмент для автономных цифровых агентов. С учетом сделки Nvidia по покупке Groq и многомиллиардного контракта с OpenAI, борьба за скорость инференса становится главным полем битвы в ИИ-индустрии, где время отклика напрямую определяет эффективность бизнеса.

Поделиться

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!