Стартап DeepSeek, основанный в КНР в 2023 г., открыл свою большую языковую модель для бесплатного доступа через веб-интерфейс всем желающим еще в конце 2024 г. Но подлинный успех пришел к китайским товарищам ближе к концу января 2025-го – когда тот же ИИ-бот, готовый общаться в том числе и на английском, и на русском, стал доступен через смартфонное приложение. Модель DeepSeek R1 оказалась настолько хороша даже в сравнении с платными версиями ChatGPT и Bing AI, причем как в синтетических тестах для проверки способностей искусственного интеллекта, так и при решении практических пользовательских задач, что его приложение уже к 25 января (а это, напомним, была суббота) стало лидером загрузок на iOS в США, Великобритании, Канаде, Сингапуре и в самой же КНР.
В следующий же понедельник, 27-го, на внезапный взлет популярности китайского «убийцы ChatGPT» бурно отреагировали американские биржи. Совокупно ведущие компании ИТ-сектора, так или иначе связанные с темой генеративного искусственного интеллекта, потеряли за торговый день под триллион долларов – одна только Nvidia просела на 589 млрд, т. е. почти на 17% своей рыночной стоимости. Упали акции и разработчиков/изготовителей «железа» для ИИ (Marvell, Broadcom, Micron, TSMC), и создателей собственно генеративных моделей (признанной в РФ экстремистской Meta, Alphabet, Oracle, Microsoft, Tesla и пр.). Индекс S&P 500 снижался в моменте на 1,8%, Nasdaq – на 3,4%.
Почему же появление в открытом доступе интерфейса для бесплатной связи с онлайновым ИИ-ботом из Китая так потрясло американские рынки? Все просто: в последние два с лишним года связанные с ИИ сегменты ИТ-рынка едва ли не единственные – на волне неутихающего ажиотажа вокруг этой темы – показывали стабильно положительную динамику. Буквально все аналитики и эксперты признавали, что хотя искусственный интеллект – это крайне дорого, сложно и ресурсоемко, но альтернативы ему нет, и в перспективе он обязательно позволит вернуть инвестируемые в него огромные средства. Главное, не переставать прямо сейчас закачивать все новые десятки и сотни миллиардов долларов в разработку все более крупных моделей и создание все более мощных серверных графических адаптеров, способных их исполнять.
И вот появляется стартап из КНР, который израсходовал на создание своей DeepSeek R1 весьма скромную сумму в юанях, эквивалентную 5,58 млн долл., – всего-то 2% от аналогичных расходов на GPT-4o, лежащую сегодня в основе бота ChatGPT.
Подробные тесты DeepSeek R1 (PDF)
При этом обучение китайской модели (точнее, ее полной версии DeepSeek-V3, оптимизацией которой по размеру и скорости работы выступает R1) проводилось на серверном кластере, содержащем всего 2048 графических ускорителей Nvidia H800 (это специально урезанные в смысле производительности на ИИ-задачах версии ускорителя H100, официально запрещенного Минторгом США к экспорту в КНР). Та же GPT-4o требовала для своей тренировки десятков тысяч полноценных H100 –в частности, по этой причине она и обошлась дороже, и требует подписки для использования через облако. DeepSeek R1 же доступна даже для локального исполнения на персональном компьютере – модель эта не только бесплатная, но и с открытыми для публики весами.
Стоимость доступа по API к DeepSeek также критически ниже, чем к схожей по качеству ChatGPT o1: токен вывода почти в 30 раз дешевле, чем у сервиса OpenAI. (Россиянам будет приятно узнать, что доступ к китайскому серверу можно получить безо всяких ухищрений с VPN и иностранными картами, необходимыми для работы по API с американским ChatGPT.)
Что же в итоге получается: хотя DeepSeek R1 не тотально доминирует над моделями OpenAI и прочих американских разработчиков – где-то показывает себя лучше, где-то хуже, – она бесспорно сопоставима с ними по результатам своей работы. Аналитики Morgan Stanley нелицеприятно указывают, что сам этот факт обрушивает долгое время выстраивавшуюся в американоцентричной ИИ-сфере прямую зависимость: больше – значит, умнее. А вот и нет: вливания десятков миллиардов долларов во все более крупные и требующие все более мощного «железа» генеративные модели, до сих пор бесспорно оправданные в глазах инвесторов, в одночасье потеряли смысл. Точнее, пока только грозят потерять: если вдруг чудесным образом не выяснится, что более дорогостоящие в разработке американские ИИ чем-то все же превосходят свои бюджетные аналоги из КНР.
Стало быть, у инвесторов появляются непростые вопросы к базирующимся в США ИИ-компаниям – и если те в ближайшие месяцы, а лучше недели, не представят внятных и убедительных ответов, щедрая накачка биржевого пузыря искусственного интеллекта может одномоментно прекратиться. Чем это обернется для глобального ИТ-рынка в целом – а на нем, напомним, практически одни только связанные с ИИ направления и растут в последние полтора-два года, – можно только предполагать.