آنتروپیک از Claude Fable 5 با جهش بزرگ در کدنویسی AI و امنیت سایبری رونمایی کرد

ایتنا
itna.ir
پنجنشبه 21 خرداد 1405
آنتروپیک Claude Fable 5
آنتروپیک از Claude Fable 5 رونمایی کرد؛ جهش بزرگ در کدنویسی AI

شرکت آنتروپیک با معرفی Claude Fable 5 و Claude Mythos 5 نسل تازه‌ای از مدل‌های هوش مصنوعی خود را به بازار عرضه کرد. این مدل‌ها با تمرکز بر عملکرد پیشرفته در کدنویسی، امنیت سایبری و تحلیل علمی طراحی شده‌اند. گزارش‌ها نشان می‌دهد این دو مدل می‌توانند رقابت در بازار هوش مصنوعی را وارد مرحله جدیدی کنند.

شرکت آنتروپیک (Anthropic) از دو مدل جدید هوش مصنوعی با نام‌های Claude Fable 5 و Claude Mythos 5 رونمایی کرده است؛ دو سیستمی که در ظاهر به‌عنوان نسخه‌های جداگانه معرفی می‌شوند، اما در عمل از نظر سطح توانمندی پایه بسیار نزدیک هستند و تفاوت اصلی آن‌ها در میزان دسترسی، محدودیت‌های ایمنی و نوع کاربردهاست.

به نقل از Venturebeat، مدل Claude Fable 5 به‌عنوان نسخه عمومی‌تر، از امروز در اختیار اکثر کاربران و توسعه‌دهندگان قرار گرفته و نسبت به نسخه‌های قبلی Claude در حوزه‌هایی مانند مهندسی نرم‌افزار، تحلیل دانش، بینایی ماشین، پژوهش علمی و انجام وظایف پیچیده و طولانی‌مدت عملکرد بهتری ارائه می‌دهد. آنتروپیک ادعا می‌کند این مدل در بسیاری از بنچمارک‌های مهم هوش مصنوعی، حتی از رقبا نیز پیشی گرفته است. به‌طور خاص، در آزمون SWE-bench Pro برای حل مسائل پیچیده برنامه‌نویسی، این مدل به امتیاز ۸۰.۳ درصد رسیده که بالاتر از GPT-5.5 با ۵۸.۶ درصد گزارش شده است. همچنین در معیار FrontierCode Diamond نیز عملکرد بسیار بالاتری نسبت به مدل‌های قبلی و رقبا ثبت کرده است.

یکی از ویژگی‌های مهم Fable 5 توانایی انجام وظایف مهندسی نرم‌افزار به‌صورت مستقل و طولانی‌مدت است. آنتروپیک می‌گوید این مدل می‌تواند بدون نیاز به نظارت مداوم انسان پروژه‌های پیچیده را مدیریت کند و حتی در مواردی مانند مهاجرت کد در پایگاه‌های بسیار بزرگ، عملکرد چشمگیری داشته است. برای نمونه، شرکت Stripe اعلام کرده این مدل توانسته یک پروژه مهاجرت کد در پایگاه ۵۰ میلیون خطی را تنها در یک روز انجام دهد؛ کاری که به‌صورت دستی ماه‌ها زمان نیاز داشت. شرکت‌هایی مانند Cursor، Replit و Figma نیز از عملکرد بالای این مدل در کدنویسی و توسعه نرم‌افزار ابراز رضایت کرده‌اند.

از نظر ایمنی، Fable 5 دارای لایه‌های حفاظتی جدیدی است که درخواست‌های حساس در حوزه‌هایی مانند امنیت سایبری، شیمی و زیست‌شناسی را شناسایی کرده و به‌طور خودکار به مدل قدیمی‌تر Claude Opus 4.8 منتقل می‌کند. به گفته آنتروپیک، بیش از ۹۵ درصد جلسات کاری این مدل بدون نیاز به دخالت مدل‌های دیگر انجام می‌شود و در آزمایش‌های گسترده نیز راهی برای دور زدن کامل محدودیت‌های امنیتی آن شناسایی نشده است.

در مقابل، Claude Mythos 5 نسخه‌ای پیشرفته‌تر اما بسیار محدودتر از نظر دسترسی است. این مدل بیشتر برای کاربران تأییدشده، پژوهشگران و شرکای امنیتی در پروژه‌هایی مانند Project Glasswing طراحی شده است. Mythos 5 بخشی از محدودیت‌های ایمنی Fable را ندارد و همین موضوع باعث شده در حوزه‌های حساس‌تر مانند امنیت سایبری پیشرفته و علوم زیستی، توانمندتر عمل کند. با این حال دسترسی عمومی به آن فعلاً وجود ندارد.

در حوزه امنیت سایبری، Mythos 5 در معیارهایی مانند ExploitBench و CyberGym عملکرد بسیار بالاتری نسبت به مدل‌های قبلی ثبت کرده است. در حوزه علوم زیستی نیز آنتروپیک مدعی است این مدل می‌تواند فرایند طراحی دارو و تحلیل پروتئین را به شکل قابل توجهی تسریع کند. گزارش‌ها نشان می‌دهد در برخی آزمایش‌ها، استفاده از این مدل توانسته روند طراحی دارو را تا حدود ۱۰ برابر سریع‌تر کند و در تعدادی از موارد، نتایج آن به نامزدهای واقعی دارویی منجر شده است.

یکی از نکات مهم در استراتژی آنتروپیک این است که به جای تفکیک سنتی «مدل ضعیف و قوی»، تفاوت اصلی میان Fable و Mythos در نحوه مدیریت ریسک و سطح آزادی در انجام وظایف حساس تعریف شده است. Fable 5 با محدودیت‌های ایمنی گسترده‌تر برای استفاده عمومی طراحی شده، در حالی که Mythos 5 برای کاربردهای تخصصی و پرریسک‌تر در اختیار گروه‌های محدود قرار می‌گیرد.

از نظر قیمت‌گذاری، هر دو مدل با نرخ ۱۰ دلار برای هر یک میلیون توکن ورودی و ۵۰ دلار برای هر یک میلیون توکن خروجی عرضه شده‌اند که نسبت به نسخه‌های پیش‌نمایش قبلی کاهش قابل توجهی دارد، اما همچنان آن‌ها را در رده مدل‌های گران‌قیمت بازار قرار می‌دهد.

در مجموع، معرفی Fable 5 و Mythos 5 نشان‌دهنده رویکرد جدید آنتروپیک در توسعه هوش مصنوعی است؛ رویکردی که تلاش می‌کند میان قدرت، استقلال عملیاتی و کنترل ایمنی تعادل برقرار کند. Fable 5 برای استفاده گسترده سازمانی و توسعه نرم‌افزار طراحی شده و Mythos 5 بیشتر برای کاربردهای تخصصی در حوزه‌های حساس علمی و امنیتی در نظر گرفته شده است، بدون اینکه تفاوت اصلی آن‌ها در قدرت خام مدل باشد، بلکه در میزان دسترسی و سطح محدودیت‌ها تعریف می‌شود.

نظرات کاربرانکپی متنکپی لینک