
Китайская компания Moonshot AI представила Kimi-K2 — новую крупную языковую модель с открытыми весами, способную конкурировать с коммерческими аналогами, такими как GPT-4.1 и Claude Sonnet 4. Модель не имеет специализированного модуля логического вывода, но демонстрирует высокие результаты в программировании, математике и мультиязычных задачах.
Никита Сушко — младший научный сотрудник группы «Прикладное NLP» Института AIRI — рассказал о ключевых особенностях Kimi-K2 и её потенциале. Kimi-K2 построена на архитектуре Mixture of Experts (MoE), где вместо одной глубокой модели используются множество более простых «экспертов». Это позволяет ускорить генерацию ответов и увеличить объём знаний, которые модель может применять.
Ключевой инновацией Kimi-K2 является не архитектура, а её размер: предыдущая самая большая открытая модель имеет 671 миллиард параметров (Deepseek V3), тогда как Kimi-K2 имеет уже 1 триллион параметров.

Младший научный сотрудник группы “Прикладное NLP” Института AIRI
Несмотря на огромное число параметров, скорость работы модели остаётся сопоставимой с предшественниками благодаря оптимизированной структуре.
На тестах, связанных с кодом, Kimi-K2 показывает высокие результаты. Например, на SWE-bench Verified, где модели нужно находить и исправлять ошибки в реальных проектах, она набрала 65,8%, обойдя GPT-4.1 (54,6%) и уступив лишь Claude Sonnet 4.
Согласно статистике, 29% запросов к ChatGPT так или иначе связаны с кодом, так что это один из ключевых юзкейсов существующих языковых моделей.

Младший научный сотрудник группы “Прикладное NLP” Института AIRI

Модель также лидирует в LiveCodeBench (53,7%) и OJBench (27,1%), демонстрируя способность решать интерактивные и соревновательные задачи по программированию.
Moonshot AI позиционирует Kimi-K2 как модель для агентных приложений — она умеет выполнять команды, вызывать внешние инструменты, генерировать и исправлять код, а также решать многошаговые задачи.
При обучении Kimi-K2 очень много сил было вложено в создании датасетов с вызовами инструментов.

Младший научный сотрудник группы “Прикладное NLP” Института AIRI
Например, модель может проанализировать данные о зарплатах, провести статистическую оценку и создать интерактивную HTML-страницу с рекомендациями — всё в одном процессе.
Moonshot AI, основанная в 2023 году, получила серьёзную поддержку от китайских гигантов Tencent, Alibaba и Gaorong Capital. Появление Kimi-K2 укрепляет позиции Китая в гонке ИИ, где уже есть такие модели, как Deepseek и Qwen.
Пользователям конкуренция только на руку. Kimi-K2 довольно дешёвая, по сравнению со многими конкурентами, модель.

Младший научный сотрудник группы “Прикладное NLP” Института AIRI
Открытость весов позволяет развёртывать модель на собственных мощностях, что делает её привлекательной для разработчиков и компаний.
Создатели Kimi-K2 планируют добавить модуль логического вывода, что может ещё больше повысить её эффективность. Пока же модель уже доказала свою конкурентоспособность в ключевых задачах — от программирования до сложных математических вычислений.