Дешёвый ИИ — это миф: раскрыты истинные затраты DeepSeek
Фото из открытых источников
Сотрудники китайского стартапа DeepSeek заявили о якобы крайне низком потреблении вычислительных ресурсов для разработки своего нашумевшего продукта R1. Модель способна конкурировать с o1 от OpenAI, а создатели уверяют, что её обучение обошлось всего в $6 млн, при этом задействовали 2048 графических процессоров. Но эксперты аналитической фирмы SemiAnalysis выяснили, что компания, которая стоит за DeepSeek, потратила на оборудование $1,6 млрд и имеет парк из 50 000 графических процессоров Nvidia Hopper.
Как сообщает ресурс tomshardware.com, отчет SemiAnalysis утверждает, что DeepSeek имеет крупную вычислительную инфраструктуру, включающую около 50 000 графических процессоров Hopper. Ресурсы, распределенные по нескольким площадкам, используются для обучения ИИ, исследования и финансового моделирования. эксперты подсчитали: общие капиталовложения компании в серверы достигают $1,6 млрд, тогда как операционные расходы составляют $944 млн.
DeepSeek стала «наследницей» китайского хедж-фонда High-Flyer, давно начавшего инвестировать в технологии искусственного интеллекта и активно закупавшего графические процессоры. В 2023 году High-Flyer организовала выделение DeepSeek в отдельное предприятие, полностью сосредоточившееся на разработке ИИ.
Утверждается, что DeepSeek финансируется только за счет собственных средств, а это позволяет ей оставаться гибкой и оперативной. Хотя позиционируется она как небольшая компания, но аналитики SemiAnalysis выяснили: она инвестировала в свои разработки более $500 млн.
Ещё одно отличие новой китайской компании: стартап не полагается на внешних поставщиков облачных услуг, DeepSeek, а имеет собственные дата-центры. Что позволяет сохранять полный контроль над экспериментами и оптимизацией моделей, ускоряя эволюцию.
Важно, что DeepSeek привлекает таланты лишь из материкового Китая, делая ставку на практические навыки и умения, а не на формальные дипломы. Выпускников ведущих китайских университетов сюда привлекают высокими зарплатами: есть данные, что ИИ-исследователи в DeepSeek могут получать более $1,3 млн в год.
Коллектив делает ставку на рост эффективности и оптимизацию алгоритмов, а не на усиление вычислительных мощностей. Успехи DeepSeek основаны на стратегических инвестициях в миллиарды долларов, технических прорывах и высококонкурентной команде.
Напомним: мы недавно рассказали об откровенном заявлении главы стартапа DeepSeek Лян Вэньфэня. Он признался в беседе с американским блогером Лексом Фридманом, что основой для наиболее продвинутой из работающих на сегодняшний день нейросетей стал код советских программистов1985-го года.
Читайте также:
Китайский стартап DeepSeek обрушил мировой рынок ИИ на $1 трлн за сутки
Фото из открытых источников В понедельник, 27 января, акции американской Nvidia рухнули на...
Эксперты Bloomberg объяснили, почему новая китайская нейросеть DeepSeek посеяла панику на американском рынке ИИ
Китайская технологическая компания DeepSeek, основанная в 2023 году, всего за год сумела удивить и...
Supermicro расширила портфель продуктов для ИИ с системами и стойками с NVIDIA Blackwell
Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облачных вычислений, хранения данных и...
«Возникновение угроз»: командование ВМС США запретило использовать китайские технологии искусственного интеллекта DeepSeek
Из-за вероятности возникновения угроз для национальной безопасности командование ВМС США запретило...
Глава стартапа DeepSeek признался, что его создали на основе технологий СССР
Фото из открытых источников Многие аналитики уверяли, что прорывная технология китайского DeepSeek...
Supermicro начала выпуск трех решений SuperCluster на базе NVIDIA для генеративного ИИ
Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облака, хранилищ данных и 5G/Edge,...
Supermicro добавляет 3 объекта в Кремниевой долине и в мире с учетом роста систем жидкостного охлаждения
Компания Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облачных хранилищ и 5G/Edge,...
Supermicro выпустила SuperCluster Plug-and-Play для NVIDIA Omniverse
Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облачных вычислений, хранения данных и...
Новая линейка Supermicro задействует потенциал ИИ в периферийных вычислительных средах
Supermicro, Inc., производитель комплексных ИТ-решений для ИИ, облачных вычислений, хранения данных...
Supermicro расширил поставки стоек с жидкостным охлаждением для конвергенции ИИ с HPC
Supermicro, Inc., поставщик комплексных ИТ-решений для ИИ, облака, хранения данных и 5G/Edge,...
OpenAI объявила о вакансиях исследователей по разработке «ИИ-железа»
Фото из открытых источников OpenAI, ведущая компания в области искусственного интеллекта,...
Компания Supermicro представила решение хранилища данных ИИ
Supermicro, Inc., производитель полных ИТ-решений для ИИ, облачных систем, хранилищ данных и...