جمینای ۳.۵ Flash می‌تواند صفحه نمایش شما را ببیند و از رایانه‌تان استفاده کند

تکفارس
نویسنده: عباس پور اشرف
پنجنشبه 04 تیر 1405
جمینای ۳.۵ Flash
نسخه ۳.۵ Flash جمینای اکنون به قابلیت استفاده از رایانه به‌صورت داخلی مجهز شده است.

نسخه ۳.۵ Flash جمینای اکنون به قابلیت استفاده از رایانه به‌صورت داخلی مجهز شده است.

این مدل قادر است محتوای صفحه نمایش را مشاهده کند و بدون نیاز به دخالت مستقیم کاربر، اقدامات لازم را انجام دهد.

این قابلیت در حال حاضر از طریق رابط برنامه‌نویسی جمینای برای توسعه‌دهندگان و همچنین در پلتفرم سازمانی Gemini Enterprise Agent Platform در دسترس مشتریان تجاری و سازمانی قرار گرفته است.

گوگل در ماه‌های اخیر امکانات متعددی را به جمینای اضافه کرده و آن را با سرویس‌های کاری خود مانند Drive یکپارچه کرده تا این هوش مصنوعی برای کاربران عادی کاربردی‌تر شود. با این حال، این شرکت هم‌زمان روی قابلیت‌های تازه‌ای برای توسعه‌دهندگان و سازمان‌ها نیز تمرکز کرده. هدف از این اقدامات، ساده‌تر کردن فرایند ساخت عامل‌های هوش مصنوعی است؛ عامل‌هایی که بتوانند استدلال کنند، در محیط‌های مختلف جابه‌جا شوند و به‌طور مستقل وظایف گوناگون را انجام دهند.

گوگل در یک پست وبلاگی اعلام کرده که قابلیت استفاده از رایانه اکنون به‌عنوان ابزاری داخلی در جمینای ۳.۵ Flash ارائه شده. پیش از این، توسعه‌دهندگان برای ساخت عامل‌های هوش مصنوعی سفارشی باید از مدل اختصاصی Gemini 2.5 Computer Use استفاده می‌کردند، اما دیگر نیازی به این کار وجود ندارد. نسخه جدید از طریق Gemini API و همچنین پلتفرم Gemini Enterprise Agent Platform در اختیار توسعه‌دهندگان قرار گرفته است.

برای نمایش توانایی‌های این قابلیت، گوگل یک نمونه مبتنی بر Browserbase راه‌اندازی کرده که کاربران می‌توانند در آن وظیفه‌ای را به مدل واگذار کنند. پس از دریافت درخواست، جمینای ۳.۵ Flash به‌صورت خودکار در مرورگر جابه‌جا می‌شود، اقدامات لازم را انجام می‌دهد و در پایان نتیجه نهایی را به کاربر ارائه می‌کند.

برای مثال، ما از این سیستم خواستیم ارزان‌ترین پروازهای مسیر دهلی نو به توکیو را پیدا کند. جمینای به سه وب‌سایت مختلف رزرو بلیت هواپیما مراجعه نمود، تاریخ‌های رفت و برگشت را وارد کرد، گزینه‌های موجود را بررسی و در نهایت بهترین پیشنهادها را در اختیارمان قرار داد. همچنین می‌توان از آن خواست بازی ۲۰۴۸ را اجرا نماید و مشاهده کرد که چگونه برای دستیابی به بالاترین امتیاز ممکن، حرکت‌های مختلف را انتخاب و خانه‌ها را با یکدیگر ادغام می‌کند.

البته توانایی کنترل رایانه و انجام مستقل وظایف مختلف، به‌ویژه برای مشتریان سازمانی، نگرانی‌هایی را درباره امنیت ایجاد می‌کند. گوگل برای کاهش این خطرات از روش آموزش هدفمند در برابر حملات خصمانه استفاده کرده. افزون بر این، دو سازوکار حفاظتی جدید نیز در قابلیت استفاده از رایانه در جمینای ۳.۵ Flash در نظر گرفته شده است. نخست اینکه می‌توان مدل را طوری تنظیم کرد که پیش از انجام عملیات حساس یا اقداماتی که قابل بازگشت نیستند، تأیید صریح کاربر را دریافت کند. دوم اینکه در صورت شناسایی حملات تزریق دستور، فرایند انجام وظیفه به‌طور خودکار متوقف خواهد شد.

گوگل همچنین به توسعه‌دهندگان توصیه کرده که این تدابیر امنیتی را در کنار محیط‌های ایزوله و امن، کنترل‌های سخت‌گیرانه دسترسی و سازوکارهای نظارت انسانی به کار بگیرند. قابلیت استفاده از رایانه در جمینای ۳.۵ Flash از همین امروز در دسترس قرار دارد.

نظرات کاربرانکپی متنکپی لینک