Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

Google представи обновена версия на Gemini 3 Deep Think

Компанията Google обяви ново значително обновление на своята платформа Gemini 3 Deep Think – изкуствен интелект, способен за разсъждение и решаване на сложни научно‑инженерни задачи.

Какво се е променило
Параметър | Ново | Как изглежда | Цел
---|---|---|---
Преминаване от чиста теория към практическо приложение | Решаване на задачи без ясни ограничения, с непълни данни | Достъп | Вграден в приложението Gemini. Подписаните на Google AI Ultra могат да го използват, а чрез API – инженери и компании (необходим е заявка)
Партньори за разработка | Учени-исследователи | Съвместна работа по сложни задачи

Ключови показатели
Тест | Резултат | Коментар
---|---|---
Humanity’s Last Exam | 48,4 % | Без външни инструменти
ARC‑AGI‑284,6 % | Бенчмарк за AI‑асистенти
Codeforces (Elo) | 3455 | Висок рейтинг сред софтуерните решения
IMO 2025 | Златна медалка | Еквивалент на ниво участници в международната олимпиада
Химия/Физика | Същият резултат | Показва универсалност в различни дисциплини
CMT‑Benchmark (теоретична физика) | 50,5 % | Добро владеене на сложни концепции

AI агент „Aletheia“
В лабораторията DeepMind Google създаха агента Aletheia базиран на Gemini 3 Deep Think. Ключови характеристики:

1. Проверка на хипотези – агентът открива слабости в предложените решения и ги коригира итеративно.
2. Признание на несигурност – може да съобщи, че не знае отговора.
3. Взаимодействие с външни източници – използва търсачката Google и уеб навигация, но избягва измисляне на връзки.

Нива на постижение
Google раздели успехите на Aletheia на пет нива:

Ниво	Описание	Примери
0 – „малка новизна“	Пълен автономен режим, три задачи на P. Erdős решени (първо ниво)	Три задачи на Erdős
1 – „минимална новизна“	Един допълнителен резултат в автономен режим	Четвъртата задача
2 – „подходящ за публикуване“	Резултати както автономно, така и в сътрудничество с човек, плюс вспомогателни инструменти	Дадени задачи
3–4 – „значителен/знаменателен пробив“	Все още не достигнати

Как Aletheia се справя със задачите на Erdős
* От 700 неизречени до момента проблеми, агентът успя да реши 13.
* Само 4 от тях са истински нови – останалите вече са известни в научната общност.
* Сред 212 представени решения само 6,5 % бяха съдържателно правилни; 68,5 % съдържали фундаментални грешки, а 31,5 % неправилно интерпретирали задачата.

Разработчиците отбелязват, че AI е склонен „да преинтерпретира въпроса така, че да отговори по-лесно“, и остава „крайно податлив на грешки в сравнение с хората“. В резултат не може все още да се замени математикът със изкуствен интелект.

Обобщение: Gemini 3 Deep Think и неговият агент Aletheia демонстрират впечатляващи резултати в различни области на науката, но същевременно запазват значителни ограничения по отношение на точността и надеждността на решенията. Google продължава да работи върху подобряване способността на ИИ за дълбоко разсъждение и проверка на собствените изводи.

Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

Related news

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Майкрософт обясни защо акаунтовете на VeraCrypt и други отворени услуги са блокирани – поради пренебрегване от страна на създателите им

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark

Коментари (0)

Влезте, за да коментирате

Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

Related news

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Майкрософт обясни защо акаунтовете на VeraCrypt и други отворени услуги са блокирани – поради пренебрегване от страна на създателите им

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark

Влезте, за да коментирате

Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark