Комплексът Anthropic Claude от 16 ИИ‑агента самостоятелно създаде компилатор за C.

Кратка версия

В рамките на експеримента компанията Anthropic събра група от 16 автономни ИИ агенти, които заедно от нулата създадоха компилатор на езика C на Rust. Резултатът е „чиста“ реализация, която може да сглоби ядрото Linux 6.19 и да компилира проекти като PostgreSQL, SQLite, Redis, FFmpeg и QEMU, но остава значително зад GCC по качество и ефективност.

Как беше направено
Етап | Какво се случи
---|---
Подготовка | 16 копия на модела Claude Opus 4.6 бяха стартирани в отделни Docker‑контейнери без достъп до интернет. Всеки от тях клонира общото Git репозиторио и получава задачи чрез lock‑файлове.
Самостоятелно планиране | Няма централизиран координатор: всеки агент сам определя какъв „очевиден“ фрагмент работа да изпълни следващ. При конфликт при сливане кодът се обединява автоматично.
Разработка | Агенти имат задача да напишат компилатора за C от нулата. Работата продължи 2 седмици и изисква почти 2000 сесии Claude Code.
Тестване | За да не „засорят“ контекста на модела със дълги заявки, тестовете се изпълняват в режим “сводка” (само няколко реда от изхода). За ускорение е добавен бърз режим за обработка 1–10 % от тестовете.

Краен продукт
* Обем – около 100 000 реда Rust код.
* Функционалност – може да сглоби ядрото Linux 6.19 на x86, ARM и RISC‑V; компилира PostgreSQL, SQLite, Redis, FFmpeg, QEMU; преминава ~99 % от тестовете на GCC.
* Ограничения – не генерира 16-битен машинен код (за стартиране на Linux се изисква GCC), асемблерът и линкера работят с грешки, а производителността на кода е по-ниска от тази на GCC. Качеството на оригиналния Rust код оставя желание за подобрение в сравнение със работа на опитен програмист.

Какво струваше експеримента
Показател | Стойност
---|---
Токени Claude API | ~\$20 000
Допълнителни разходи (обучение на модела, организация на проекта, тестови набори) | Не включени в посочената сума

Уроци и заключения
1. Пределът на автономията – при увеличение на кода до ~100 000 реда агентите спрат напълно да разбират проекта; това вероятно е горната граница за самостоятелна ИИ.
2. Необходимост от поддръжка – опитите за разширяване на функционалността често разрушават вече работещи части от кода.
3. Важността на средата за разработка – изолацията от интернет и правилната настройка на тестовете се окаже критична за стабилната работа на агентите.

Заключение
Експериментът показва, че съвременните ИИ модели могат да генерират сложни софтуерни системи с минимален контрол. Все пак те все още не могат напълно да заменят опитните разработчици: качеството на кода, производителността и надеждността остават по-ниски от традиционните компилатори, а мащабът на проекта е ограничен до стотици хиляди реда. Това е важна крачка напред, но все още далеч от пълно автономно разработване на софтуер.

Комплексът Anthropic Claude от 16 ИИ‑агента самостоятелно създаде компилатор за C.

Related news

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Майкрософт обясни защо акаунтовете на VeraCrypt и други отворени услуги са блокирани – поради пренебрегване от страна на създателите им

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark

Коментари (0)

Влезте, за да коментирате

Комплексът Anthropic Claude от 16 ИИ‑агента самостоятелно създаде компилатор за C.

Related news

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Майкрософт обясни защо акаунтовете на VeraCrypt и други отворени услуги са блокирани – поради пренебрегване от страна на създателите им

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark

Влезте, за да коментирате

Google Gemini набра 750 млн месечни активни потребители, като остави ChatGPT само на малко разстояние от лидера.

Nothing представи бета‑версия на Essential Apps – платформа за създаване на мини‑приложения с помощта на изкуствен интелект

Прилагането Meta✴ AI заема петото място в App Store след старта на Muse Spark