Google стартира Gemini 3 Deep Think – напреднал AI‑услуга за научни задачи, която продължава да „настройва“ отговорите според заявките.
Google представи обновена версия на Gemini 3 Deep Think
Компанията Google обяви ново значително обновление на своята платформа Gemini 3 Deep Think – изкуствен интелект, способен за разсъждение и решаване на сложни научно‑инженерни задачи.
Какво се е променило
Параметър | Ново | Как изглежда | Цел
---|---|---|---
Преминаване от чиста теория към практическо приложение | Решаване на задачи без ясни ограничения, с непълни данни | Достъп | Вграден в приложението Gemini. Подписаните на Google AI Ultra могат да го използват, а чрез API – инженери и компании (необходим е заявка)
Партньори за разработка | Учени-исследователи | Съвместна работа по сложни задачи
Ключови показатели
Тест | Резултат | Коментар
---|---|---
Humanity’s Last Exam | 48,4 % | Без външни инструменти
ARC‑AGI‑284,6 % | Бенчмарк за AI‑асистенти
Codeforces (Elo) | 3455 | Висок рейтинг сред софтуерните решения
IMO 2025 | Златна медалка | Еквивалент на ниво участници в международната олимпиада
Химия/Физика | Същият резултат | Показва универсалност в различни дисциплини
CMT‑Benchmark (теоретична физика) | 50,5 % | Добро владеене на сложни концепции
AI агент „Aletheia“
В лабораторията DeepMind Google създаха агента Aletheia базиран на Gemini 3 Deep Think. Ключови характеристики:
1. Проверка на хипотези – агентът открива слабости в предложените решения и ги коригира итеративно.
2. Признание на несигурност – може да съобщи, че не знае отговора.
3. Взаимодействие с външни източници – използва търсачката Google и уеб навигация, но избягва измисляне на връзки.
Нива на постижение
Google раздели успехите на Aletheia на пет нива:
| Ниво | Описание | Примери |
|---|---|---|
| 0 – „малка новизна“ | Пълен автономен режим, три задачи на P. Erdős решени (първо ниво) | Три задачи на Erdős |
| 1 – „минимална новизна“ | Един допълнителен резултат в автономен режим | Четвъртата задача |
| 2 – „подходящ за публикуване“ | Резултати както автономно, така и в сътрудничество с човек, плюс вспомогателни инструменти | Дадени задачи |
| 3–4 – „значителен/знаменателен пробив“ | Все още не достигнати |
Как Aletheia се справя със задачите на Erdős
* От 700 неизречени до момента проблеми, агентът успя да реши 13.
* Само 4 от тях са истински нови – останалите вече са известни в научната общност.
* Сред 212 представени решения само 6,5 % бяха съдържателно правилни; 68,5 % съдържали фундаментални грешки, а 31,5 % неправилно интерпретирали задачата.
Разработчиците отбелязват, че AI е склонен „да преинтерпретира въпроса така, че да отговори по-лесно“, и остава „крайно податлив на грешки в сравнение с хората“. В резултат не може все още да се замени математикът със изкуствен интелект.
Обобщение: Gemini 3 Deep Think и неговият агент Aletheia демонстрират впечатляващи резултати в различни области на науката, но същевременно запазват значителни ограничения по отношение на точността и надеждността на решенията. Google продължава да работи върху подобряване способността на ИИ за дълбоко разсъждение и проверка на собствените изводи.
Коментари (0)
Споделете мнението си — моля, бъдете учтиви и по темата.
Влезте, за да коментирате