آنتروپیک نسخه جدید مدل میانرده خود، Sonnet 4.6 را معرفی کرد. این مدل با پنجره متنی ۱ میلیون توکنی و بهبود در کدنویسی و تعامل با رایانه عرضه میشود. Sonnet 4.6 در بنچمارکهایی مانند ARC-AGI-2 و SWE-Bench امتیازات قابل توجهی کسب کرده است.
شرکت Anthropic از نسخه جدید مدل میانرده خود با نام Sonnet 4.6 رونمایی کرد. این عرضه در چارچوب چرخه بهروزرسانی چهارماهه این شرکت انجام شده و نشان میدهد آنتروپیک همچنان بر توسعه مستمر خانواده مدلهای زبانی خود تمرکز دارد.
به نقل از Techcrunch، در پست رسمی معرفی این مدل، آنتروپیک بر بهبودهای قابل توجه Sonnet 4.6 در حوزههایی نظیر کدنویسی، تبعیت دقیقتر از دستورالعملها و توانایی تعامل و استفاده از رایانه تأکید کرده است. به گفته این شرکت، Sonnet 4.6 از این پس بهعنوان مدل پیشفرض برای کاربران طرحهای رایگان و حرفهای در دسترس خواهد بود.
پنجره متنی ۱ میلیون توکنی در نسخه بتا
# نسخه بتای Sonnet 4.6 به یک پنجره متنی با ظرفیت ۱ میلیون توکن مجهز شده است؛ ظرفیتی که نسبت به بزرگترین پنجره متنی پیشین این خانواده، دو برابر افزایش یافته است. آنتروپیک این قابلیت را «کافی برای نگهداری کامل پایگاههای کد، قراردادهای طولانی یا دهها مقاله پژوهشی در قالب یک درخواست واحد» توصیف میکند. چنین ظرفیتی میتواند برای توسعهدهندگان نرمافزار، پژوهشگران و تیمهای حقوقی که با اسناد حجیم سروکار دارند، مزیت رقابتی قابل توجهی ایجاد کند.
ادامه روند عرضه پس از Opus 4.6
# عرضه Sonnet 4.6 تنها دو هفته پس از معرفی مدل Opus 4.6 انجام میشود؛ موضوعی که نشاندهنده شتاب بالای آنتروپیک در بهروزرسانی سبد محصولاتش است. همچنین انتظار میرود نسخه بهروزشده مدل Haiku نیز طی هفتههای آینده معرفی شود تا چرخه تکمیل خانواده مدلهای این شرکت ادامه یابد.
عملکرد در بنچمارکهای تخصصی
# Sonnet 4.6 با مجموعهای از امتیازات قابل توجه در بنچمارکهای معتبر عرضه شده است. این مدل در آزمون OS World که عملکرد در استفاده از رایانه را میسنجد و همچنین در SWE-Bench ویژه مهندسی نرمافزار، رکوردهای جدیدی ثبت کرده است.
اما یکی از شاخصترین نتایج مربوط به کسب امتیاز ۶۰.۴ درصدی در آزمون ARC-AGI-2 است؛ معیاری که برای سنجش مهارتهای نزدیک به هوش انسانی طراحی شده است. این امتیاز، Sonnet 4.6 را بالاتر از بسیاری از مدلهای همرده قرار میدهد، هرچند همچنان از مدلهایی مانند Gemini 3 Deep Think و نسخه اصلاحشده GPT-5.2 عقبتر است.
در مجموع، Sonnet 4.6 را میتوان گامی دیگر در مسیر رقابت فشرده میان توسعهدهندگان مدلهای زبانی پیشرفته دانست؛ رقابتی که با تمرکز بر افزایش ظرفیت پردازش، بهبود دقت در اجرای دستورالعملها و ارتقای توانایی تعامل با محیطهای نرمافزاری، هر روز ابعاد تازهتری به خود میگیرد.