Комплексът Anthropic Claude от 16 ИИ‑агента самостоятелно създаде компилатор за C.
Кратка версия
В рамките на експеримента компанията Anthropic събра група от 16 автономни ИИ агенти, които заедно от нулата създадоха компилатор на езика C на Rust. Резултатът е „чиста“ реализация, която може да сглоби ядрото Linux 6.19 и да компилира проекти като PostgreSQL, SQLite, Redis, FFmpeg и QEMU, но остава значително зад GCC по качество и ефективност.
Как беше направено
Етап | Какво се случи
---|---
Подготовка | 16 копия на модела Claude Opus 4.6 бяха стартирани в отделни Docker‑контейнери без достъп до интернет. Всеки от тях клонира общото Git репозиторио и получава задачи чрез lock‑файлове.
Самостоятелно планиране | Няма централизиран координатор: всеки агент сам определя какъв „очевиден“ фрагмент работа да изпълни следващ. При конфликт при сливане кодът се обединява автоматично.
Разработка | Агенти имат задача да напишат компилатора за C от нулата. Работата продължи 2 седмици и изисква почти 2000 сесии Claude Code.
Тестване | За да не „засорят“ контекста на модела със дълги заявки, тестовете се изпълняват в режим “сводка” (само няколко реда от изхода). За ускорение е добавен бърз режим за обработка 1–10 % от тестовете.
Краен продукт
* Обем – около 100 000 реда Rust код.
* Функционалност – може да сглоби ядрото Linux 6.19 на x86, ARM и RISC‑V; компилира PostgreSQL, SQLite, Redis, FFmpeg, QEMU; преминава ~99 % от тестовете на GCC.
* Ограничения – не генерира 16-битен машинен код (за стартиране на Linux се изисква GCC), асемблерът и линкера работят с грешки, а производителността на кода е по-ниска от тази на GCC. Качеството на оригиналния Rust код оставя желание за подобрение в сравнение със работа на опитен програмист.
Какво струваше експеримента
Показател | Стойност
---|---
Токени Claude API | ~\$20 000
Допълнителни разходи (обучение на модела, организация на проекта, тестови набори) | Не включени в посочената сума
Уроци и заключения
1. Пределът на автономията – при увеличение на кода до ~100 000 реда агентите спрат напълно да разбират проекта; това вероятно е горната граница за самостоятелна ИИ.
2. Необходимост от поддръжка – опитите за разширяване на функционалността често разрушават вече работещи части от кода.
3. Важността на средата за разработка – изолацията от интернет и правилната настройка на тестовете се окаже критична за стабилната работа на агентите.
Заключение
Експериментът показва, че съвременните ИИ модели могат да генерират сложни софтуерни системи с минимален контрол. Все пак те все още не могат напълно да заменят опитните разработчици: качеството на кода, производителността и надеждността остават по-ниски от традиционните компилатори, а мащабът на проекта е ограничен до стотици хиляди реда. Това е важна крачка напред, но все още далеч от пълно автономно разработване на софтуер.
Коментари (0)
Споделете мнението си — моля, бъдете учтиви и по темата.
Влезте, за да коментирате