The Economist: DeepSeek разрушает миф о необходимости миллиардных инвестиций в ИИ

Источник: BFM.RU | Дата: 6 часов назад

Журнал прочит эпоху малых и дешевых нейросетей, сравнимых по качеству с флагманскими проектами. Другие западные СМИ опасаются китайской цензуры глобальных масштабов

The Economist называет обвал капитализации чипмейкеров после рождения DeepSeek благом для развития искусственного интеллекта. Журнал напоминает, что Nvidia стала самой дорогой компанией мира (по некоторым данным, с рентабельностью в 90%) на вере IT-гигантов в дороговизну ИИ — мощнее чипы, сильнее нейросеть, несите ваши денежки. Согласно статье, инновация китайских разработчиков разрушила этот миф и теперь все начнут делать умные модели за смешные деньги, Google и Microsoft кусают локти, а Apple радуется, что не стала раскошеливаться на ИИ раньше времени. Власти США обвинили DeepSeek в «дистилляции» своей модели на основе продуктов OpenAI, хотя и не привели подробностей.

Предосудительно ли это и возможно ли повторить успех в России? Комментирует эксперт по информационной безопасности, гендиректор Phishman Алексей Горелкин:

Алексей Горелкин эксперт по информационной безопасности, гендиректор Phishman «Дистилляция — это просто оптимизация. Любая сеть дистиллированная, и OpenAI дистиллированный. Просто китайцы придумали, как это сделать очень дешево. Как они это оптимизировали — хороший вопрос. Я уверен, есть ноу-хау. Даже если это ноу-хау построено на базе других моделей, которые могли использоваться, это уже не важно, потому что главное, что ноу-хау сработало. Получили дешево довольно оптимизированную AI. Отвечаю на вопрос: «А почему это не могут сделать товарищи из России?» Потому что в России инженеры любят делать сложно. То есть не просто делать, а сложно делать. Вот китайцы любят делать просто: берут и копируют один к одному, делают базовый функционал. А наши инженеры всегда хотят сделать что-то классное, чтобы это было на выставках. Можем ли мы такое сделать? Конечно, можем, но это будет только повтор за тем, что уже сделали товарищи из Поднебесной».

Другой лейтмотив на тему DeepSeek в зарубежной прессе — настройки цензуры в китайском сервисе. Сообщается, что модель отказывается говорить на чувствительные для Пекина темы, например о протестах на площади Тяньаньмэнь или в Гонконге. «Бизнес FM» задала DeepSeek несколько подобных вопросов, и как минимум один раз модель нейтрально рассказала о произошедшем, но в большинстве случаев блокировалась. Для сравнения: вопросы с формулировками про «коррупцию Трампа» или «зверства США в Ираке» никаких возражений не вызывали.

Заглянуть под капот системы ограничений позволяет особенность DeepSeek R1: прежде чем выдать ответ, модель сначала печатает свои внутренние размышления о сути вопроса. Например, вот как рассуждала нейросеть, когда ее спросили о российско-украинском конфликте:

Подобные рассуждения — особенность нейросетей, созданных по технологии mixture of experts, то есть что-то вроде «коллегии экспертов». DeepSeek позволяет как бы читать мысли составных частей модели, которые, особенно при сложном вопросе, действительно похожи на разговор группы специалистов. IBM указывает, что подход позволяет значительно быстрее обучать модели, что также могло стать фактором успеха китайских разработчиков.

Безотносительно цензуры и обвинений в «дистилляции» американских нейросетей The Economist называет быстроту и дешевизну DeepSeek «революционной инновацией» в мире искусственного интеллекта.

Источник: BFM.RU