شرکت آنتروپیک یک آزمایش شگفتانگیز انجام داده که در آن عوامل هوش مصنوعی بهطور مشترک و تقریباً بدون دخالت انسان یک کامپایلر C کامل ساختند. این پروژه که توسط پژوهشگر نیکلاس کارلینی هدایت شده، نشان میدهد که همکاری خودگردان هوش مصنوعی در توسعه نرمافزارهای واقعی تا چه حد پیشرفت کرده است.
این کامپایلر طی دو هفته با استفاده از ۱۶ عامل مستقل Claude Opus 4.6 توسعه یافت. هر عامل هوش مصنوعی در یک کانتینر Docker مجزا اجرا شد و بدون یک کنترلکننده مرکزی یا مدیر انسانی کار کرد. وظایف بهطور خودکار انتخاب میشدند، تناقضها از طریق Git حل میگردیدند و کد بدون نظارت به مخزن اصلی ارسال میشد. در مجموع، این عوامل حدود ۱۰۰,۰۰۰ خط کد Rust در نزدیک به ۲,۰۰۰ جلسه برنامهنویسی تولید کردند و هزینه استفاده از API تقریباً ۲۰,۰۰۰ دلار بود.
نتیجه، یک کامپایلر C کاملاً کاربردی و متنباز است که از صفر نوشته شده. این کامپایلر میتواند هسته لینوکس ۶.۹ را برای معماریهای x86 ،ARM و RISC-V بهطور موفقیتآمیز کامپایل کند و پروژههای متنباز مهم مانند PostgreSQL ،SQLite ،Redis و FFmpeg را مدیریت نماید. در مجموعه آزمایشهای سختگیرانه GCC Torture Test Suite، این کامپایلر ۹۹ درصد موفقیت کسب کرد. بهعنوان یک نقطه عطف نمادین، حتی بازی Doom را کامپایل و اجرا کرد که معیار طولانیمدتی برای توانایی کامپایلرها محسوب میشود.
این پروژه نشان میدهد که سیستمهای هوش مصنوعی اکنون قادر به خودهماهنگی، مدیریت پایگاههای کد بزرگ و ارائه نرمافزار زیرساختی در سطح تولید هستند. هرچند کامپایلر هنوز محدودیتهایی دارد و جایگزین کامل GCC نیست، این آزمایش گامی مهم در جهت مهندسی نرمافزار خودگردان و طولانیمدت مبتنی بر هوش مصنوعی محسوب میشود.
با این آزمایش، احتمال دارد در آینده نحوه ساخت نرمافزار تغییر کند. برای توسعهدهندگان، عوامل هوش مصنوعی میتوانند وظایف تکراری، بازسازیهای بزرگ، تست و رفع اشکال را بر عهده بگیرند و انسانها را قادر سازند بیشتر بر طراحی، معماری و حل مسئله تمرکز کنند. همزمان، این موضوع پرسشهای جدیدی درباره کیفیت کد، اعتماد و تأیید صحت ایجاد میکند. هرچند برنامهنویسان انسانی هنوز منسوخ نشدهاند، نقش آنها ممکن است از نوشتن تکتک خطوط کد به هدایت، بازبینی و اعتبارسنجی سیستمهای خودگردان ساختهشده توسط هوش مصنوعی تغییر کند.