​​ИИ без логики, но с умом: чем интересен Kimi-K2, который превзошёл GPT-4

Fine-news 4 часов назад 24
Preview
 чем интересен Kimi-K2, который превзошёл GPT-4

Китайская компания Moonshot AI представила Kimi-K2 — новую крупную языковую модель с открытыми весами, способную конкурировать с коммерческими аналогами, такими как GPT-4.1 и Claude Sonnet 4. Модель не имеет специализированного модуля логического вывода, но демонстрирует высокие результаты в программировании, математике и мультиязычных задачах.

Никита Сушко — младший научный сотрудник группы «Прикладное NLP» Института AIRI — рассказал о ключевых особенностях Kimi-K2 и её потенциале. Kimi-K2 построена на архитектуре Mixture of Experts (MoE), где вместо одной глубокой модели используются множество более простых «экспертов». Это позволяет ускорить генерацию ответов и увеличить объём знаний, которые модель может применять.

Ключевой инновацией Kimi-K2 является не архитектура, а её размер: предыдущая самая большая открытая модель имеет 671 миллиард параметров (Deepseek V3), тогда как Kimi-K2 имеет уже 1 триллион параметров.

Никита Сушко
Младший научный сотрудник группы “Прикладное NLP” Института AIRI

Несмотря на огромное число параметров, скорость работы модели остаётся сопоставимой с предшественниками благодаря оптимизированной структуре.

На тестах, связанных с кодом, Kimi-K2 показывает высокие результаты. Например, на SWE-bench Verified, где модели нужно находить и исправлять ошибки в реальных проектах, она набрала 65,8%, обойдя GPT-4.1 (54,6%) и уступив лишь Claude Sonnet 4.

Согласно статистике, 29% запросов к ChatGPT так или иначе связаны с кодом, так что это один из ключевых юзкейсов существующих языковых моделей.

Никита Сушко – младший научный сотрудник группы “Прикладное NLP” Института AIRI
Младший научный сотрудник группы “Прикладное NLP” Института AIRI
Ferra.ru

Модель также лидирует в LiveCodeBench (53,7%) и OJBench (27,1%), демонстрируя способность решать интерактивные и соревновательные задачи по программированию.

Moonshot AI позиционирует Kimi-K2 как модель для агентных приложений — она умеет выполнять команды, вызывать внешние инструменты, генерировать и исправлять код, а также решать многошаговые задачи.

При обучении Kimi-K2 очень много сил было вложено в создании датасетов с вызовами инструментов.

Никита Сушко – младший научный сотрудник группы “Прикладное NLP” Института AIRI
Младший научный сотрудник группы “Прикладное NLP” Института AIRI

Например, модель может проанализировать данные о зарплатах, провести статистическую оценку и создать интерактивную HTML-страницу с рекомендациями — всё в одном процессе.

Moonshot AI, основанная в 2023 году, получила серьёзную поддержку от китайских гигантов Tencent, Alibaba и Gaorong Capital. Появление Kimi-K2 укрепляет позиции Китая в гонке ИИ, где уже есть такие модели, как Deepseek и Qwen.

Пользователям конкуренция только на руку. Kimi-K2 довольно дешёвая, по сравнению со многими конкурентами, модель.

Никита Сушко – младший научный сотрудник группы “Прикладное NLP” Института AIRI
Младший научный сотрудник группы “Прикладное NLP” Института AIRI

Открытость весов позволяет развёртывать модель на собственных мощностях, что делает её привлекательной для разработчиков и компаний.

Создатели Kimi-K2 планируют добавить модуль логического вывода, что может ещё больше повысить её эффективность. Пока же модель уже доказала свою конкурентоспособность в ключевых задачах — от программирования до сложных математических вычислений.

Источник
Читать продолжение в источнике: Fine-news
Failed to connect to MySQL: Unknown database 'unlimitsecen'