DeepSeek выпустил новую математическую модель искусственного интеллекта

Hash 5 часов назад 16
Preview

DeepSeek без лишнего шума выпустил обновленную версию специализированной модели искусственного интеллекта. 30 апреля китайский стартап загрузил на Hugging Face — крупнейшую платформу для открытых моделей ИИ — свою новую модель Prover-V2, даже не удосужившись объявить об этом в социальных сетях.

Математический гений в мире алгоритмов

Серия Prover от DeepSeek — это узкоспециализированные модели, созданные для решения математических задач. Интересно, что компания пока не предоставила никаких подробностей о новой модели на своей странице Hugging Face. Файлы, которые удалось просмотреть, позволяют предположить, что Prover-V2 построена на основе модели DeepSeek V3 с впечатляющими 671 млрд параметров.

V3 использует архитектуру «смеси экспертов» — подход, обеспечивающий экономичное обучение и работу. Такая архитектура — умный ход, позволяющий получить максимальную производительность при минимальных затратах. Представьте, что вместо одного дорогостоящего суперэксперта вы нанимаете команду узкопрофильных специалистов, которые работают только когда нужны — вот вам и экономия!

Соревнование технологических гигантов

Запуск Prover-V2 произошел сразу после того, как Alibaba выпустила свою Qwen3. Гигант электронной коммерции заявил, ссылаясь на тесты, что их новейшая модель превосходит DeepSeek-R1 и модели рассуждений o1 от OpenAI.

Prover-V2 — это обновление предыдущей версии Prover-V1.5, которая дебютировала в августе, за четыре месяца до того, как DeepSeek поразил мир своей моделью V3. Компания утверждала, что V3 была разработана за долю стоимости и энергии, которые западные конкуренты тратят на обучение продвинутых моделей ИИ.

«Наша команда добилась прорыва в эффективности, — можно было бы услышать от руководителей DeepSeek. — Мы доказали, что инновации не обязательно требуют гигантских дата-центров и бюджетов размером с ВВП небольшой страны.»

Математика как ключ к продвинутому ИИ

В техническом отчете о Prover-V1.5 компания DeepSeek отметила, что работа над предварительным обучением специализированной модели улучшила возможности базовой модели в формальном доказательстве теорем и математических рассуждениях.

Разработка математически ориентированной модели, способной усилить математические навыки базовой многоцелевой модели, подогрела спекуляции о том, что DeepSeek скоро запустит дополнительные продукты.

Хотя DeepSeek официально не делится графиком или прогрессом в разработке новых моделей, компания регулярно публикует свои последние результаты исследований, включая обновления модели Prover.

В прошлом месяце DeepSeek также выпустил обновление для своей базовой модели V3, которая, согласно информации на сайте компании, отличается улучшенными возможностями рассуждений, оптимизированным программированием и обновленными навыками письма на китайском языке.

Ожидается, что в ближайшее время DeepSeek представит новую модель рассуждений R2, на фоне растущего интереса к этому направлению в индустрии ИИ.


Самые интересные и важные новости на нашем канале в Telegram

Сообщение DeepSeek выпустил новую математическую модель искусственного интеллекта появились сначала на Hash Telegraph.

Читать продолжение в источнике: Hash
Failed to connect to MySQL: Unknown database 'unlimitsecen'