Майкрософт обяви три нови вътрешни модели за изкуствен интелект за генериране на текст, реч и графика
Microsoft AI стартира три нови мултимодални модели
В рамките на усилията за укрепване на позициите в областта на изкуствения интелект (ИИ) изследователското подразделение Microsoft AI обяви пускането на три собствени модели, които могат да генерират текст, звук и изображения. Това решение стана отговор на конкуренцията с водещите лаборатории по ИИ.
МоделНазначениеКлючови показателиMAI‑Transcribe‑1Преобразува реч в текст25 езика, скорост 2,5 × по-бързо Azure FastMAI‑Voice‑1Създава аудиотрекаМинутка за една секунда, настройка на гласоветеMAI‑Image‑2Генерира изображения от текст
Екипът и лидерствотоПроектът се развивал от групата MAI Superintelligence – подразделение, занимаващо се с фундаментални изследвания в областта на напредналите ИИ‑системи. Ноябрь 2025 г. към екипа се присъедини изпълнителният директор Мустафа Сулейман (Mustafa Suleyman).
Економическа ефективностРазработчиците отделиха специално внимание на намаляването на разходите за изчисления в сравнение с аналози от Google и OpenAI:
УслугаЦенаДекодиране на текст$0,36/часСинтез на реч$22 за 1 млн символаОбработка на изображения$5 за 1 млн входни токени; $33 за генериране на 1 млн изходни токени
Моделите вече са разположени в платформата Microsoft Foundry. Транскрипцията и синтезът на реч са достъпни в MAI Playground.
Партньорство с OpenAIВъпреки активната разработка на собствени решения, Мустафа Сулейман потвърди ангажимента към сътрудничество с OpenAI: Microsoft вече е инвестирала над $13 млн. корпорацията ще продължи да използва модели от OpenAI в своите продукти според многогодишния договор, прилагайки стратегия за диверсификация подобна на работа с микрочипи.
Така Microsoft AI укрепва позициите си на пазара на ИИ, предлагайки бързи и икономични мултимодални решения, като запазва тясни връзки с ключови партньори.
Коментари (0)
Споделете мнението си — моля, бъдете учтиви и по темата.
Влезте, за да коментирате