Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.

7 software

Google представи обновена версия на Gemini 3 Deep Think

Компанията Google обяви ново значително обновление на своята платформа Gemini 3 Deep Think – изкуствен интелект, способен за разсъждение и решаване на сложни научно‑инженерни задачи.

Какво се е променило
Параметър | Ново | Как изглежда | Цел
---|---|---|---
Преминаване от чиста теория към практическо приложение | Решаване на задачи без ясни ограничения, с непълни данни | Достъп | Вграден в приложението Gemini. Подписаните на Google AI Ultra могат да го използват, а чрез API – инженери и компании (необходим е заявка)
Партньори за разработка | Учени-исследователи | Съвместна работа по сложни задачи

Ключови показатели
Тест | Резултат | Коментар
---|---|---
Humanity’s Last Exam | 48,4 % | Без външни инструменти
ARC‑AGI‑284,6 % | Бенчмарк за AI‑асистенти
Codeforces (Elo) | 3455 | Висок рейтинг сред софтуерните решения
IMO 2025 | Златна медалка | Еквивалент на ниво участници в международната олимпиада
Химия/Физика | Същият резултат | Показва универсалност в различни дисциплини
CMT‑Benchmark (теоретична физика) | 50,5 % | Добро владеене на сложни концепции

AI агент „Aletheia“
В лабораторията DeepMind Google създаха агента Aletheia базиран на Gemini 3 Deep Think. Ключови характеристики:

1. Проверка на хипотези – агентът открива слабости в предложените решения и ги коригира итеративно.
2. Признание на несигурност – може да съобщи, че не знае отговора.
3. Взаимодействие с външни източници – използва търсачката Google и уеб навигация, но избягва измисляне на връзки.

Нива на постижение
Google раздели успехите на Aletheia на пет нива:

НивоОписаниеПримери
0 – „малка новизна“Пълен автономен режим, три задачи на P. Erdős решени (първо ниво)Три задачи на Erdős
1 – „минимална новизна“Един допълнителен резултат в автономен режимЧетвъртата задача
2 – „подходящ за публикуване“Резултати както автономно, така и в сътрудничество с човек, плюс вспомогателни инструментиДадени задачи
3–4 – „значителен/знаменателен пробив“Все още не достигнати

Как Aletheia се справя със задачите на Erdős
* От 700 неизречени до момента проблеми, агентът успя да реши 13.
* Само 4 от тях са истински нови – останалите вече са известни в научната общност.
* Сред 212 представени решения само 6,5 % бяха съдържателно правилни; 68,5 % съдържали фундаментални грешки, а 31,5 % неправилно интерпретирали задачата.

Разработчиците отбелязват, че AI е склонен „да преинтерпретира въпроса така, че да отговори по-лесно“, и остава „крайно податлив на грешки в сравнение с хората“. В резултат не може все още да се замени математикът със изкуствен интелект.

Обобщение: Gemini 3 Deep Think и неговият агент Aletheia демонстрират впечатляващи резултати в различни области на науката, но същевременно запазват значителни ограничения по отношение на точността и надеждността на решенията. Google продължава да работи върху подобряване способността на ИИ за дълбоко разсъждение и проверка на собствените изводи.

Коментари (0)

Споделете мнението си — моля, бъдете учтиви и по темата.

Все още няма коментари. Оставете коментар и споделете мнението си!

За да оставите коментар, моля, влезте в профила си.

Влезте, за да коментирате