آنتروپیک Sonnet 4.6 را با پنجره ۱ میلیون توکنی معرفی کرد

ایتنا
itna.ir
چهارشنبه 29 بهمن 1404
Sonnet 4.6 آنتروپیک
این مدل، آنتروپیک بر بهبودهای قابل توجه Sonnet 4.6 در حوزه‌هایی نظیر کدنویسی، تبعیت دقیق‌تر از دستورالعمل‌ها و توانایی تعامل و استفاده از رایانه تأکید کرده است.

آنتروپیک نسخه جدید مدل میان‌رده خود، Sonnet 4.6 را معرفی کرد. این مدل با پنجره متنی ۱ میلیون توکنی و بهبود در کدنویسی و تعامل با رایانه عرضه می‌شود. Sonnet 4.6 در بنچمارک‌هایی مانند ARC-AGI-2 و SWE-Bench امتیازات قابل توجهی کسب کرده است.

شرکت Anthropic از نسخه جدید مدل میان‌رده خود با نام Sonnet 4.6 رونمایی کرد. این عرضه در چارچوب چرخه به‌روزرسانی چهارماهه این شرکت انجام شده و نشان می‌دهد آنتروپیک همچنان بر توسعه مستمر خانواده مدل‌های زبانی خود تمرکز دارد.

به نقل از Techcrunch، در پست رسمی معرفی این مدل، آنتروپیک بر بهبودهای قابل توجه Sonnet 4.6 در حوزه‌هایی نظیر کدنویسی، تبعیت دقیق‌تر از دستورالعمل‌ها و توانایی تعامل و استفاده از رایانه تأکید کرده است. به گفته این شرکت، Sonnet 4.6 از این پس به‌عنوان مدل پیش‌فرض برای کاربران طرح‌های رایگان و حرفه‌ای در دسترس خواهد بود.

پنجره متنی ۱ میلیون توکنی در نسخه بتا

نسخه بتای Sonnet 4.6 به یک پنجره متنی با ظرفیت ۱ میلیون توکن مجهز شده است؛ ظرفیتی که نسبت به بزرگ‌ترین پنجره متنی پیشین این خانواده، دو برابر افزایش یافته است. آنتروپیک این قابلیت را «کافی برای نگهداری کامل پایگاه‌های کد، قراردادهای طولانی یا ده‌ها مقاله پژوهشی در قالب یک درخواست واحد» توصیف می‌کند. چنین ظرفیتی می‌تواند برای توسعه‌دهندگان نرم‌افزار، پژوهشگران و تیم‌های حقوقی که با اسناد حجیم سروکار دارند، مزیت رقابتی قابل توجهی ایجاد کند.

ادامه روند عرضه پس از Opus 4.6

عرضه Sonnet 4.6 تنها دو هفته پس از معرفی مدل Opus 4.6 انجام می‌شود؛ موضوعی که نشان‌دهنده شتاب بالای آنتروپیک در به‌روزرسانی سبد محصولاتش است. همچنین انتظار می‌رود نسخه به‌روزشده مدل Haiku نیز طی هفته‌های آینده معرفی شود تا چرخه تکمیل خانواده مدل‌های این شرکت ادامه یابد.

عملکرد در بنچمارک‌های تخصصی

Sonnet 4.6 با مجموعه‌ای از امتیازات قابل توجه در بنچمارک‌های معتبر عرضه شده است. این مدل در آزمون OS World که عملکرد در استفاده از رایانه را می‌سنجد و همچنین در SWE-Bench ویژه مهندسی نرم‌افزار، رکوردهای جدیدی ثبت کرده است.

اما یکی از شاخص‌ترین نتایج مربوط به کسب امتیاز ۶۰.۴ درصدی در آزمون ARC-AGI-2 است؛ معیاری که برای سنجش مهارت‌های نزدیک به هوش انسانی طراحی شده است. این امتیاز، Sonnet 4.6 را بالاتر از بسیاری از مدل‌های هم‌رده قرار می‌دهد، هرچند همچنان از مدل‌هایی مانند Gemini 3 Deep Think و نسخه اصلاح‌شده GPT-5.2 عقب‌تر است.

در مجموع، Sonnet 4.6 را می‌توان گامی دیگر در مسیر رقابت فشرده میان توسعه‌دهندگان مدل‌های زبانی پیشرفته دانست؛ رقابتی که با تمرکز بر افزایش ظرفیت پردازش، بهبود دقت در اجرای دستورالعمل‌ها و ارتقای توانایی تعامل با محیط‌های نرم‌افزاری، هر روز ابعاد تازه‌تری به خود می‌گیرد.

منبع این گزارش

نظرات کاربرانکپی متنکپی لینک