DeepSeek V4 е нова модел на изкуствен интелект, която трябва да се настройва за китайски хардуерни ускорители за изчисления
DeepSeek се подготвя за пускането на новата си модел V4
Тази седмица, според *Financial Times*, китайската компания DeepSeek планира да представи долгожданната мултимодална ИИ-модель – V4. Специалното ще бъде оптимизацията за ускорителите Huawei и Cambricon, което ще позволи на китайските фирми да развиват собствените си решения без силна зависимост от импортни технологии.
Ключови дати и контекст
- Анонсът на модела ще се свърже с парламентарното заседание в КНР, започващо 4 март.
- Това ще бъде най-голямото пускане на DeepSeek от януари миналата година, когато компанията стартира модел R1. Тогава твърдеше, че новата система е сравнима по ефективност с западните аналози при значително по-ниски разходи.
Проблеми и противоречия
По-рано се установи, че DeepSeek използва данни от американски модели за обучението на своите системи и дори се опираше на ускорителите Nvidia. Въпреки това в КНР тези устройства са под санкции. Затова компанията съзнателно не е оптимизирала V4 за Nvidia-устройства.
Първите опити да обучават модела върху ускорителите Huawei се оказаха не толкова успешни, но сега DeepSeek има намерение да подобри съвместимостта с тези платформи.
Влияние на пазара
Оптимизацията на V4 за Huawei и Cambricon трябва да стимулира търсенето на тези хардуерни решения в Китай и да намали импортната зависимост. Според прогнози от експерти това ще укрепи позициите на китайския ИИ‑пазар.
Допълнителна информация
Аннотацията за модела V4 ще се появи вече тази седмица в съкратен вид; пълното описание се очаква приблизително след месец. В същото време американската компания Anthropic обвинява DeepSeek в „дистилиране“ на собствените си ИИ‑модели, което добавя напрежение към международните отношения относно технологиите за изкуствен интелект.
Коментари (0)
Споделете мнението си — моля, бъдете учтиви и по темата.
Влезте, за да коментирате