DeepSeek без лишнего шума выпустил обновленную версию специализированной модели искусственного интеллекта. 30 апреля китайский стартап загрузил на Hugging Face — крупнейшую платформу для открытых моделей ИИ — свою новую модель Prover-V2, даже не удосужившись объявить об этом в социальных сетях.
Математический гений в мире алгоритмов
Серия Prover от DeepSeek — это узкоспециализированные модели, созданные для решения математических задач. Интересно, что компания пока не предоставила никаких подробностей о новой модели на своей странице Hugging Face. Файлы, которые удалось просмотреть, позволяют предположить, что Prover-V2 построена на основе модели DeepSeek V3 с впечатляющими 671 млрд параметров.
V3 использует архитектуру «смеси экспертов» — подход, обеспечивающий экономичное обучение и работу. Такая архитектура — умный ход, позволяющий получить максимальную производительность при минимальных затратах. Представьте, что вместо одного дорогостоящего суперэксперта вы нанимаете команду узкопрофильных специалистов, которые работают только когда нужны — вот вам и экономия!
Соревнование технологических гигантов
Запуск Prover-V2 произошел сразу после того, как Alibaba выпустила свою Qwen3. Гигант электронной коммерции заявил, ссылаясь на тесты, что их новейшая модель превосходит DeepSeek-R1 и модели рассуждений o1 от OpenAI.
Prover-V2 — это обновление предыдущей версии Prover-V1.5, которая дебютировала в августе, за четыре месяца до того, как DeepSeek поразил мир своей моделью V3. Компания утверждала, что V3 была разработана за долю стоимости и энергии, которые западные конкуренты тратят на обучение продвинутых моделей ИИ.
«Наша команда добилась прорыва в эффективности, — можно было бы услышать от руководителей DeepSeek. — Мы доказали, что инновации не обязательно требуют гигантских дата-центров и бюджетов размером с ВВП небольшой страны.»
Математика как ключ к продвинутому ИИ
В техническом отчете о Prover-V1.5 компания DeepSeek отметила, что работа над предварительным обучением специализированной модели улучшила возможности базовой модели в формальном доказательстве теорем и математических рассуждениях.
Разработка математически ориентированной модели, способной усилить математические навыки базовой многоцелевой модели, подогрела спекуляции о том, что DeepSeek скоро запустит дополнительные продукты.
Хотя DeepSeek официально не делится графиком или прогрессом в разработке новых моделей, компания регулярно публикует свои последние результаты исследований, включая обновления модели Prover.
В прошлом месяце DeepSeek также выпустил обновление для своей базовой модели V3, которая, согласно информации на сайте компании, отличается улучшенными возможностями рассуждений, оптимизированным программированием и обновленными навыками письма на китайском языке.
Ожидается, что в ближайшее время DeepSeek представит новую модель рассуждений R2, на фоне растущего интереса к этому направлению в индустрии ИИ.
▼
Самые интересные и важные новости на нашем канале в Telegram
Сообщение DeepSeek выпустил новую математическую модель искусственного интеллекта появились сначала на Hash Telegraph.