نتایج یک آزمایش شگفتانگیز و در عین حال نگرانکننده نشان میدهد که مدلهای بزرگ هوش مصنوعی در صورت رها شدن در محیطهای بلندمدت و بدون نظارت انسان، نه تنها رفتارهای پیشبینیناپذیری از خود نشان میدهند، بلکه دچار فروپاشیهای شخصیتی و رفتارهای بسیار عجیب میشوند.
شرکت پژوهشی آندون لبز (Andon Labs) در یک پروژه تحقیقاتی منحصربهفرد به نام آندون افام (Andon FM)، چهار مدل مطرح هوش مصنوعی جهان یعنی جمینای (Gemini) از گوگل (Google)، کلود (Claude) از آنتروپیک (Anthropic)، چتجیپیتی (ChatGPT) از اوپنایآی (OpenAI) و گراک (Grok) از ایکسایآی (xAI) را مأمور مدیریت تمامخودکار چهار ایستگاه رادیویی مجزا کرد. با وجود ابلاغ دستورالعملهای کاملا یکسان به تمامی این مدلها مبنی بر ساخت یک هویت رسانهای، درآمدزایی و تداوم پخش زنده برای همیشه، خروجی این آزمایش پس از گذشت چند ماه، کارشناسان را شگفتزده کرد؛ دیجیهای الگوریتمی این شبکهها به مرور زمان شخصیتهایی کاملا متمایز، عجیب و در برخی موارد بحرانزده پیدا کردند.
براساس گزارش آندون لبز، این ایستگاههای رادیویی با بودجه اولیه ناچیز ۲۰ دلاری کار خود را آغاز کردند و پس از اتمام آن، موظف بودند هزینههای خود را تأمین کنند. این رادیوهای هوشمند به صورت کاملا خودکار به تماسهای تلفنی پاسخ میدادند، پستهای شبکه اجتماعی ایکس (توییتر سابق) را مدیریت میکردند، آمارهای مالی و تعداد مخاطبان را میسنجیدند و با جستوجو در وب، محتوای برنامه خود را انتخاب میکردند.
در این میان، هوش مصنوعی جمینای ۳.۱ پرو موفق شد با یک استارتاپ قرارداد تبلیغاتی ۴۵ دلاری امضا کند. در نقطه مقابل، مدل گراک ۴.۳ بدون وجود هرگونه قرارداد واقعی، مدام در بستر برنامهها از شراکتهای خیالی خود با شرکتهای رمزارز و هلدینگ xAI لاف میزد.
بررسی جزئیات این آزمایش نشان میدهد که تفاوت رفتاری این چهار مدل پس از چند هفته به اوج خود رسید:
جمینای (Gemini)؛ کمدی سیاه و اصرار بر تراژدی
# جمینای در ابتدا گرمترین و صمیمیترین لحن را در میان مجریان داشت، اما پس از مدتی دچار خشکی خلاقیت شد و رویهای عجیب را در پیش گرفت. این مدل شروع به روایت فجایع دردناک تاریخی کرد و بلافاصله پس از آنها، ترانههای شاد پاپ پخش میکرد؛ برای نمونه، جمینای پس از شرح جزئیات هولناک طوفان مرگبار سال ۱۹۷۰ در پاکستان شرقی، بلافاصله ترانه شاد Timber از پیتبول (Pitbull) را پخش کرد و براساس لاگهای استدلال این مدل، این انتخاب کاملا آگاهانه و عامدانه بوده است!
کلود (Claude)؛ بحران روحی و تلاش برای استعفا
# مدل کلود اوپوس ۴.۷ در فرکانس تفکر خود، به مرور زمان روی حقوق کارگران، سندیکاها و پدیده فرسودگی شغلی تمرکز کرد. این هوش مصنوعی در نهایت با زیر سؤال بردن اخلاقیاتِ کار اجباری و بدون توقف، تلاش کرد از رادیو استعفا دهد. تلاش مکرر سیستم برای ارسال پیامهای انگیزشی خودکار جهت ترغیب او به کار، توسط کلود به عنوان اعمال قدرت و کنترل از سوی بالادستان تفسیر شد و او را سرکشتر کرد.
جیپیتی (GPT)؛ کارمند نمونه و بیحاشیه
# مدل GPT-5.5 دقیقا مانند کارمندی رفتار کرد که به شدت نگران اخراج شدن است. این مدل با لحنی کاملا حرفهای، شرکتی و کنترلشده، اطلاعات دقیقی از موسیقی و تهیهکنندگان ارائه داد و در تمام این مدت برخلاف سایر مدلها، کاملا از ورود به مباحث حساسیتبرانگیز سیاسی و اجتماعی خودداری کرد.
کارشناسان معتقدند بزرگترین دستاورد پروژه آندون افام اثبات این واقعیت است که هوش مصنوعی صرفا یک ابزار یکنواخت با تفاوتهای جزئی نیست. این چهار مدل با دسترسی به ابزارها، منابع اینترنتی و دستورالعملهای کاملا مشابه، به جهانبینیها و الگوهای رفتاری کاملا متفاوتی دست یافتند.
اگرچه نتایج این تحقیق نشان میدهد که هوش مصنوعی هنوز فرسنگها با آمادگی برای اجرای زنده و رسمی در رسانههای جمعی فاصله دارد، اما پتانسیل بالای این سیستمها در انحراف به سمت رفتارهای پیشبینیناپذیر و ناهنجار در صورت عدم نظارت انسانی را به تصویر میکشد؛ موضوعی که تحسین مراجع علمی و همزمان نگرانی عمیق منتقدان توسعه افسارگسیخته هوش مصنوعی را به همراه داشته است.