Китайский стартап DeepSeek на днях произвел революцию. Он выкатил инновационную модель ИИ, способную задвинуть гиганта OpenAI. ChatGPT в AppStore он уже обогнал.
Козырной туз DeepSeek — цена
Его модель в 14 раз дешевле GPT-4 и обучалась на графических процессорах Nvidia H800 всего 2 месяца. Такую немыслимую эффективность китайской модели подарили уникальные архитектуры Multi-token Prediction (MTP) и Mixture of Experts (MoE).
Пока OpenAI ставит на сложные и дорогие системы с миллиардами параметров, DeepSeek использует минимум вычислительных ресурсов без ущерба производительности.
DeepSeek – убийца Nvidia?
«Покупайте дорогущие GPU для обучения ИИ, без этого никак!», – убеждал нас американский гигант. Но DeepSeek, построенный на менее мощных GPU, показал, что сверхдорогие серверы не так уж и нужны.
Пока чат GPT-4 активирует 1,8 трлн параметров одновременно, DeepSeek применяет другую стратегию, где затраты на обучение снижены до 90%. И что самое печальное для конкурентов, его производительность при этом не хуже.
А еще у DeepSeek открытый исходный код. Теперь любой студент может замутить стартап и разработать собственные решения, не тратя миллионы на обучение:
- использование API у OpenAI стоит $2,5 за 1млн токенов;
- у DeepSeek — всего $0,14.
Что и говорить, гиганты в панике. Трамп тут недавно собрался инвестировать полтриллиона долларов в ИИ. Но надо ли «затапливать» деньгами такие компании, если все то же самое можно сделать намного дешевле?
Ждем медиавойну США и Китая: каждая сторона будет убеждать человечество, что только они делают нормальный ИИ, а оппоненты пытаются втюхать неработающую ерунду за большие деньги.
Хотя китайская модель хорошо работает, однако до ChatGPT ей еще, как от Москвы до Пекина пешком: не хватает многих фишек.
Возможно, их докрутят, но ведь и американцы сейчас могут взять на вооружение новый подход DeepSeek к вычислениям, снова завоевав лидерство в этой сфере.
Подписывайтесь на наш канал в Телеграм: все главные новости о финансах, ничего лишнего!