نسخه ۳.۵ Flash جمینای اکنون به قابلیت استفاده از رایانه بهصورت داخلی مجهز شده است.
این مدل قادر است محتوای صفحه نمایش را مشاهده کند و بدون نیاز به دخالت مستقیم کاربر، اقدامات لازم را انجام دهد.
این قابلیت در حال حاضر از طریق رابط برنامهنویسی جمینای برای توسعهدهندگان و همچنین در پلتفرم سازمانی Gemini Enterprise Agent Platform در دسترس مشتریان تجاری و سازمانی قرار گرفته است.
گوگل در ماههای اخیر امکانات متعددی را به جمینای اضافه کرده و آن را با سرویسهای کاری خود مانند Drive یکپارچه کرده تا این هوش مصنوعی برای کاربران عادی کاربردیتر شود. با این حال، این شرکت همزمان روی قابلیتهای تازهای برای توسعهدهندگان و سازمانها نیز تمرکز کرده. هدف از این اقدامات، سادهتر کردن فرایند ساخت عاملهای هوش مصنوعی است؛ عاملهایی که بتوانند استدلال کنند، در محیطهای مختلف جابهجا شوند و بهطور مستقل وظایف گوناگون را انجام دهند.
گوگل در یک پست وبلاگی اعلام کرده که قابلیت استفاده از رایانه اکنون بهعنوان ابزاری داخلی در جمینای ۳.۵ Flash ارائه شده. پیش از این، توسعهدهندگان برای ساخت عاملهای هوش مصنوعی سفارشی باید از مدل اختصاصی Gemini 2.5 Computer Use استفاده میکردند، اما دیگر نیازی به این کار وجود ندارد. نسخه جدید از طریق Gemini API و همچنین پلتفرم Gemini Enterprise Agent Platform در اختیار توسعهدهندگان قرار گرفته است.
برای نمایش تواناییهای این قابلیت، گوگل یک نمونه مبتنی بر Browserbase راهاندازی کرده که کاربران میتوانند در آن وظیفهای را به مدل واگذار کنند. پس از دریافت درخواست، جمینای ۳.۵ Flash بهصورت خودکار در مرورگر جابهجا میشود، اقدامات لازم را انجام میدهد و در پایان نتیجه نهایی را به کاربر ارائه میکند.
برای مثال، ما از این سیستم خواستیم ارزانترین پروازهای مسیر دهلی نو به توکیو را پیدا کند. جمینای به سه وبسایت مختلف رزرو بلیت هواپیما مراجعه نمود، تاریخهای رفت و برگشت را وارد کرد، گزینههای موجود را بررسی و در نهایت بهترین پیشنهادها را در اختیارمان قرار داد. همچنین میتوان از آن خواست بازی ۲۰۴۸ را اجرا نماید و مشاهده کرد که چگونه برای دستیابی به بالاترین امتیاز ممکن، حرکتهای مختلف را انتخاب و خانهها را با یکدیگر ادغام میکند.
البته توانایی کنترل رایانه و انجام مستقل وظایف مختلف، بهویژه برای مشتریان سازمانی، نگرانیهایی را درباره امنیت ایجاد میکند. گوگل برای کاهش این خطرات از روش آموزش هدفمند در برابر حملات خصمانه استفاده کرده. افزون بر این، دو سازوکار حفاظتی جدید نیز در قابلیت استفاده از رایانه در جمینای ۳.۵ Flash در نظر گرفته شده است. نخست اینکه میتوان مدل را طوری تنظیم کرد که پیش از انجام عملیات حساس یا اقداماتی که قابل بازگشت نیستند، تأیید صریح کاربر را دریافت کند. دوم اینکه در صورت شناسایی حملات تزریق دستور، فرایند انجام وظیفه بهطور خودکار متوقف خواهد شد.
گوگل همچنین به توسعهدهندگان توصیه کرده که این تدابیر امنیتی را در کنار محیطهای ایزوله و امن، کنترلهای سختگیرانه دسترسی و سازوکارهای نظارت انسانی به کار بگیرند. قابلیت استفاده از رایانه در جمینای ۳.۵ Flash از همین امروز در دسترس قرار دارد.