НVIDIA се подготвя за битка за инференса, създавайки чип базиран на технологиите Groq за OpenAI и AI‑агенти.
Новият чип на Nvidia – стъпка към по-бързи AI‑приложения
Nvidia планира да представи през март нов процесор, създаден специално за ускоряване на инференса (изчисленията на вече обучени модели) и насочен към клиенти като OpenAI. Това е смяна в посоката на компанията, която преди беше по-скоро фокусирана върху обучение на AI‑системи.
Какво точно ще се появи
- Новата платформа ще бъде представена на конференцията за разработчици GTC (Graphics Technology Conference).
- В ядрото на платформата ще войде чип от стартапа Groq – едно от най-бързите решения за инференс.
- Платформата трябва да се конкурира със собствените ускорители на Google и Amazon, които вече са постигнали значителни успехи.
Защо това е важно
Със зростането на популярността на „вейб‑кодинга“ (генериране на код от AI по текст) търсенето за бърза и енергийно ефективна инфраструктура се увеличава.
За OpenAI новият процесор става ключов фактор:
- В януари компанията сключи споразумение с Cerebras за чип, насочен към инференс, който според тях е по-бърз от конкурентите.
- Преди това OpenAI обяви голяма сделка с Nvidia, в рамките на която получиха „отделени мощности за инференс“ и инвестираха 30 млн. долара от „зеления“ производител.
Конкурентна среда
Компания | Продукт | Ориентация
Nvidia | GPU семейство Hopper, Blackwell, Rubin | Обучение и инференс
Google | TPU | Инференс
Amazon | Trainium | Инференс
Cerebras | Специализиран чип | Инференс
Groq | Чипове с „блокове за езиково обработване“ | Инференс
Nvidia задържа над 90 % от пазарния дял на GPU, но нейните чипове често се считат за скъпи и енергийно интензивни за задачи по инференс. Това привлича вниманието на компании, търсещи алтернатива.
Ключови приложения
- Генериране на код: услугите Claude Code (Anthropic) и Codex (OpenAI) използват облачните инфраструктури на Amazon и Google, но Codex планира да премине към новата платформа Nvidia.
- Таргетиране на реклама: Meta сътрудничи с Nvidia за инференс на AI‑системи, където централните процесори се оказват най-ефективни.
Извод
Nvidia не само разширява своята продуктова линия, но и влиза в пряка конкуренция с гигантите от индустрията. Новият чип, интегриран със стартапа Groq, може да се превърне във решаващ фактор за компании, стремящи се към по-бързо и икономично обработване на AI‑модели.
Коментари (0)
Споделете мнението си — моля, бъдете учтиви и по темата.
Влезте, за да коментирате