Posted 29 января, 08:49
Published 29 января, 08:49
Modified 29 января, 08:51
Updated 29 января, 08:51
Александр Куманев
DeepSeek — это платформа, разработанная одноименной китайской компанией, основанной в 2023 году. Владеет ею хедж-фонд High-Flyer, специализирующийся на применении ИИ в разработке алгоритмов для торговли ценными бумагами.
Первую волну интереса к проекту вызвал запуск модели DeepSeek-V3, состоявшийся в декабре 2024 года. На это были объективные причины: бюджет разработки составил ничтожные для отрасли 5,5 млн долларов, а машинное обучение заняло 55 дней, что объясняется инженерными инновациями и оптимизацией. Уже тогда нейросеть привлекла внимание СМИ, но специалисты следили за развитием проекта и до этого.
Для сравнения: бюджет разработки ChatGPT оценивается от 100 млн до 1 млрд долларов — компания не раскрывает информацию. Портал Verge отмечает, что американские фирмы на развитие своих нейросетей потратили миллиарды.
Китайские разработчики в области ИИ находятся под санкциями США и ограничены в доступе к производительным чипам, которые получают конкуренты в лице OpenAI и Google.
«Ограничения ресурсов — прекрасная вещь. Инстинкт выживания в условиях жесткой конкуренции ИИ — главный двигатель прорывов. Я давно слежу за DeepSeek. В прошлом году у них была одна из лучших моделей с открытым кодом», — отметил преимущества DeepSeek-V3 старший научный сотрудник компании Nvidia и руководитель AI Agents Initiative Джим Фэн.
По оценке экспертов, разработчики использовали 2048 графических процессоров Nvidia H800, но оборудование продемонстрировало прогресс ближе к 16 тыс. ИИ-ускорителей, в то время как в разработке аналогов применяют около 100 тыс. единиц.
Фактически небольшой китайский стартап, состоящий из 200 человек, совершил прорыв в мире AI. Как выяснилось позднее, это был лишь первый удар.
20 января компания выпустила продвинутую модель DeepSeek-R1, которая оказалась еще более производительной и эффективной. Платформа имеет открытый исходный код, а значит, его могут свободно и бесплатно изучать другие разработчики, адаптируя базовую модель под свои нужды. Библиотеки DeepSeek и OpenAI полностью совместимы, что позволяет заменить платные API американской компании на бесплатную версию китайского стартапа.
В режиме «Рассуждения» ИИ выстраивает логические цепочки для генерации более точного ответа — все это занимает несколько секунд, а пользователь может следить за размышлениями чат-бота.
Команде исследователей Unsloth удалось сжать ИИ DeepSeek-R1 до 131 Гб за счет урезания малозначительных блоков. Запуск модели возможен на компьютере с 20 Гб ОЗУ. Во время тестирования сжатой версии программисты создали клон игры Flappy Bird.
Компания выпустила и мобильное приложение DeepSeek — AI Assistant. Ему потребовалось всего несколько дней, чтобы обойти ChatGPT в американском App Store и стать самым скачиваемым. В Google Play чат-бот занял первую строчку в категории «Работа» среди бесплатных приложений и шестое место в общем рейтинге. Его уже скачали более 1 млн раз, а средняя оценка составляет 4,6 звезды. Чат-бот работает бесплатно, в то время как OpenAI предлагает самую производительную модель по подписке в размере 200 долларов в месяц. Чтобы сдержать прорыв китайской платформы, новую модель OpenAI o3 mini решили сделать бесплатной.
ИИ DeepSeek-R1 вошел в топ-5 моделей по оценке бенчмарка Chatbot Arena.
По оценке качества ответов китайский чат-бот занял второе место в рейтинге Artificial-Analysis.
Стоит отметить, что DeepSeek-R1 способен конкурировать с аналогами не во всех дисциплинах. Чат-бот с этим соглашается, указывая на преимущества ChatGPT в творческих задачах и более глубоком знании русского языка. Себя же он считает более стабильным в плане доступа для пользователей из России, а также более эффективным в технических вопросах. Среди недостатков обеих моделей он отмечает обучение преимущественно на западном континенте у конкурента и ориентацию на азиатский сегмент у себя.
Фэн считает, что платформы с открытым исходным кодом обеспечивают развитие отрасли, хотя в прошлом году велись дискуссии об установке вычислительного порога для подобных платформ. Такой подход он охарактеризовал как высокомерие Кремниевой долины, а результаты китайского стартапа назвал «унизительным звонком» для выступающих за ограничения.
Китайский стартап решил идти дальше. После успешного запуска чат-бота DeepSeek-R1 компания выпустила мультимодальную нейросеть Janus-Pro-7B с открытым кодом для работы с изображениями. Ее можно использовать в коммерческих целях без ограничений.
В бенчмарках ИИ-генерация изображений модели Janus-Pro-7B обошла открытую Stable Diffusion 3 Medium и платную DALL-E 3 от OpenAI.
«Выпуск Janus-Pro-7B пришелся на время, когда в ландшафте ИИ доминирует интенсивная конкуренция. Предложения OpenAI, такие как GPT-4 и DALL-E 3, давно стали эталонами в области генеративного ИИ. Аналогично такие модели, как Stable Diffusion и другие, продолжают лидировать в креативных приложениях ИИ. С Janus-Pro-7B DeepSeek сделал смелый шаг в сторону прямой конкуренции с этими титанами отрасли», — отмечает портал ChatHub.
Релиз модели сотряс мир технологий, что обернулось падением акций американских компаний, занимающихся разработками в области ИИ. Лихорадить рынок начало 27 ноября.
Если верить китайским разработчикам на слово, им удалось запустить конкурента для ChatGPT и Gemini с жесткими ограничениями вычислительной мощности. Главной «жертвой» DeepSeek ожидаемо стал производитель ИИ-ускорителей — Nvidia. За сутки капитализация компания сократилась на 620 млрд долларов (-17,8%), что является рекордом рынка.
Состояние основателя компании Дженсена Хуанга сократилось на 20% — 20 млрд долларов. Больше него потерял только соучредитель Oracle Ларри Эллисон — 22,6 млрд (-12%). Второе место по суточному падению стоимости заняла компания Broadcom (-17,31%). Подешевели акции Alphabet (-4,19%), AMD (-6,39%), Intel (2,55%) и некоторых других западных фирм, в то время как акции китайских разработчиков подорожали. Индекс Nasdaq 100 за сутки упал на 3,1%.
В совокупности компании потеряли почти 1 трлн долларов. 500 богатейших людей планеты «обеднели» на 108 млрд долларов, отмечает Bloomberg.
«В конечном итоге превосходство США обусловлено технологиями и лидерством американских компаний в области искусственного интеллекта. Внедрение модели DeepSeek заставляет инвесторов усомниться в лидерстве американских компаний, а также в том, сколько тратится и приведут ли эти расходы к прибыли (или перерасходу средств)», — сказал аналитик Truist Кит Лернер в беседе с CNN.
«Рост DeepSeek может спровоцировать возобновление интереса инвесторов к недооцененным китайским компаниям ИИ, обеспечив альтернативную линию развития», — отметил главный инвестиционный стратег Saxo Чар Чанан.
«Меры экспортного контроля, возможно, контрпродуктивны», — допустил профессор инженерии и права в Калифорнийском университете в Лос-Анджелесе Джон Вилласенор.
Гендиректор OpenAI Сэм Альтман назвал DeepSeek-R1 впечатляющей моделью, «особенно если учесть, что они могут предложить за такую цену». Он пообещал, что его компания сможет предоставить «гораздо лучшие модели», и анонсировал «несколько релизов». По его словам, появление нового конкурента воодушевляет.
Президент США Дональд Трамп похвалил прорыв Китая в области ИИ и назвал это «тревожным звонком» для американских технологических компаний. По его мнению, ситуация может принести пользу его стране.
Неожиданное появление амбициозного конкурента у американских разработчиков вызвало споры среди экспертов. Существуют версии, согласно которым для обучения DeepSeek использовались производительные чипы Nvidia, их могли получить в обход санкций, хотя сам производитель чипов отрицает это. Некоторые исследователи считают, что китайский стартап мог использовать до 50 тыс. чипов, другие — что производительных ИИ-ускорителей было немного, а разработчики создали смешанную структуру.
Многие западные специалисты убеждены, что реальная стоимость разработки могла оказаться выше заявленной. Другие же отмечают инновационный подход инженеров, внедрение прорывных решений и глубокой оптимизации процессов.
Судя по динамике развития ситуации, интерес к темам ИИ-модели DeepSeek и нейросетям будет удерживаться, а американские разработчики с их возможностями нанесут ответный удар. Уже сейчас можно утверждать, что появление DeepSeek изменило правила игры на рынке ИИ.