НVIDIA се подготвя за битка за инференса, създавайки чип базиран на технологиите Groq за OpenAI и AI‑агенти.

НVIDIA се подготвя за битка за инференса, създавайки чип базиран на технологиите Groq за OpenAI и AI‑агенти.

8 hardware

Новият чип на Nvidia – стъпка към по-бързи AI‑приложения

Nvidia планира да представи през март нов процесор, създаден специално за ускоряване на инференса (изчисленията на вече обучени модели) и насочен към клиенти като OpenAI. Това е смяна в посоката на компанията, която преди беше по-скоро фокусирана върху обучение на AI‑системи.

Какво точно ще се появи
- Новата платформа ще бъде представена на конференцията за разработчици GTC (Graphics Technology Conference).

- В ядрото на платформата ще войде чип от стартапа Groq – едно от най-бързите решения за инференс.

- Платформата трябва да се конкурира със собствените ускорители на Google и Amazon, които вече са постигнали значителни успехи.

Защо това е важно
Със зростането на популярността на „вейб‑кодинга“ (генериране на код от AI по текст) търсенето за бърза и енергийно ефективна инфраструктура се увеличава.

За OpenAI новият процесор става ключов фактор:

- В януари компанията сключи споразумение с Cerebras за чип, насочен към инференс, който според тях е по-бърз от конкурентите.

- Преди това OpenAI обяви голяма сделка с Nvidia, в рамките на която получиха „отделени мощности за инференс“ и инвестираха 30 млн. долара от „зеления“ производител.

Конкурентна среда
Компания | Продукт | Ориентация
Nvidia | GPU семейство Hopper, Blackwell, Rubin | Обучение и инференс
Google | TPU | Инференс
Amazon | Trainium | Инференс
Cerebras | Специализиран чип | Инференс
Groq | Чипове с „блокове за езиково обработване“ | Инференс

Nvidia задържа над 90 % от пазарния дял на GPU, но нейните чипове често се считат за скъпи и енергийно интензивни за задачи по инференс. Това привлича вниманието на компании, търсещи алтернатива.

Ключови приложения
- Генериране на код: услугите Claude Code (Anthropic) и Codex (OpenAI) използват облачните инфраструктури на Amazon и Google, но Codex планира да премине към новата платформа Nvidia.

- Таргетиране на реклама: Meta сътрудничи с Nvidia за инференс на AI‑системи, където централните процесори се оказват най-ефективни.

Извод
Nvidia не само разширява своята продуктова линия, но и влиза в пряка конкуренция с гигантите от индустрията. Новият чип, интегриран със стартапа Groq, може да се превърне във решаващ фактор за компании, стремящи се към по-бързо и икономично обработване на AI‑модели.

Коментари (0)

Споделете мнението си — моля, бъдете учтиви и по темата.

Все още няма коментари. Оставете коментар и споделете мнението си!

За да оставите коментар, моля, влезте в профила си.

Влезте, за да коментирате