مدل پرچم‌دار GPT-5.5 با جهش بزرگ در کدنویسی عامل‌محور معرفی شد

ایمنا
imna.ir
سه شنبه 08 اردیبهشت 1405
مدل پرچم‌دار GPT-5.5 با جهش بزرگ در کدنویسی عامل‌محور معرفی شد
شرکت OpenAI امروز مدل پرچم‌دار جدید خود را با نام GPT-5.5 معرفی کرد که عملکرد بسیار بهتری در زمینه‌های برنامه‌نویسی عامل‌محور، استفاده از رایانه، پژوهش علمی و تحلیل داده نسبت به GPT 5.4 و بسیاری از رقیبان ارائه می‌دهد.

به گفته شرکت OpenAI، مدل GPT-5.5 برای انجام طیف گسترده‌ای از وظایف طراحی شده است، که از جمله آن‌ها می‌توان به نوشتن و دیباگ کردن کد، انجام پژوهش‌های آنلاین، تحلیل داده‌ها، تولید اسناد و موارد دیگر اشاره کرد.

برخلاف مدل‌های قبلی که کاربران باید مراحل مختلف کار را به صورت دستی در قالب پرامپت هدایت می‌کردند، خود این مدل جدید می‌تواند برنامه‌ریزی کند، از ابزارها استفاده نماید، خروجی‌های خود را بررسی کند و تا رسیدن به هدف مورد نظر به کار ادامه دهد. با وجود این جهش در توانایی‌ها، OpenAI بیان کرد که GPT-5.5 در استفاده واقعی، همان میزان تأخیر به ازای هر توکن را مانند GPT‑5.4 حفظ کرده است و در عین حال برای انجام همان وظایف در Codex به تعداد توکن کمتری نیاز دارد.

مدل GPT-5.5 اکنون در شاخص Coding Agent Index که توسط Artificial Analysis منتشر می‌شود، در رتبه نخست قرار گرفته، آن هم با هزینه‌ای که تقریبا نصف مدل‌های پیشرفته رقیب در حوزه برنامه‌نویسی است. در آزمون Terminal‑Bench 2.0 که عملکرد مدل‌ها را در گردش‌کارهای پیچیده خط فرمان شامل برنامه‌ریزی، تکرار مراحل و هماهنگی ابزارها می‌سنجد، این مدل پرچم‌دار امتیاز 82.7 درصد را به دست آورد. همچنین در معیار SWE‑Bench Pro که توانایی حل مسائل واقعی ثبت‌شده در گیت‌هاب را ارزیابی می‌کند، به امتیاز 58.6 درصد رسید.

مدل GPT-5.5
مدل GPT-5.5 اکنون در شاخص Coding Agent Index که توسط Artificial Analysis منتشر می‌شود، در رتبه نخست قرار گرفته، آن هم با هزینه‌ای که تقریبا نصف مدل‌های پیشرفته رقیب در حوزه برنامه‌نویسی است.

در شاخص GDPval که توانایی عامل‌ها را در انجام کارهای دانشی دقیق در 44 شغل مختلف اندازه‌گیری می‌کند، مدل GPT-5.5 امتیاز 84.9 درصد را ثبت کرده است. این مدل در آزمون OSWorld‑Verified که میزان توانایی استفاده خودکار از رایانه در محیط‌های واقعی را می‌سنجد نیز امتیاز 78.7 درصد کسب کرد. همچنین در آزمون Tau2‑bench Telecom که برای ارزیابی گردش‌کارهای پیچیده خدمات مشتریان طراحی شده است، GPT-5.5 بدون نیاز به تنظیم پرامپت به امتیاز 98 درصد دست یافت.

مدل GPT-5.5 اکنون برای کاربران ChatGPT Plus، Pro، Business و Enterprise در ChatGPT و Codex در دسترس قرار گرفته است. همچنین نسخه GPT‑5.5 Pro به تدریج برای کاربران ChatGPT Pro، Business و Enterprise در ChatGPT عرضه می‌شود. این مدل در محیط Codex نیز در حالت Fast در دسترس خواهد بود که 1.5 برابر سریع‌تر است اما هزینه آن 2.5 برابر بیشتر خواهد بود.این مدل برای توسعه‌دهندگان نیز از طریق APIهای Responses و Chat Completions ارائه می‌شود. هزینه استفاده از آن برابر با 5 دلار برای هر یک میلیون توکن ورودی و 30 دلار برای هر یک میلیون توکن خروجی تعیین شده است و این مدل از پنجره متنی یک میلیون توکنی پشتیبانی می‌کند. مانند گذشته، توسعه‌دهندگان در صورت استفاده از پردازش Batch و Flex می‌توانند از تخفیف 50 درصدی بهره‌مند شوند. نسخه GPT-5.5 Pro نیز از طریق همین APIها در دسترس خواهد بود و هزینه آن 30 دلار برای هر یک میلیون توکن ورودی و 180 دلار برای هر یک میلیون توکن خروجی اعلام شده است. شرکت OpenAI تأکید کرده است که GPT-5.5 در مقایسه با GPT‑5.4 می‌تواند با مصرف توکن کمتر، نتایج بهتری ارائه دهد.

نظرات کاربرانکپی متنکپی لینک