امروز گوگل با معرفی مدل جدید Gemini 2.0 Flash، وارد عصر جدید Gemini 2.0 شد. گوگل ادعا میکند که این مدل جدید حتی از Gemini 1.5 Pro در معیارهای کلیدی بهتر عمل میکند و دو برابر سریعتر است.
علاوه بر عملکرد بهبود یافته و تأخیر کم، Gemini 2.0 Flash همچنین از خروجی چند رسانهای بومی، از جمله تصاویر تولید شده به صورت بومی همراه با متن و صدای چند زبانه هدایت پذیر متن به گفتار (TTS) پشتیبانی میکند. همچنین از ورودیهای چند رسانهای مانند تصاویر، ویدیو و صدا پشتیبانی میکند. این مدل جدید همچنین میتواند بطور بومی ابزارهایی مانند جستجوی گوگل، اجرای کد و سایر موارد را فراخوانی کند.
توسعه دهندگان اکنون میتوانند نسخه آزمایشی مدل Gemini 2.0 Flash را در AI Studio و Vertex AI امتحان کنند. توسعه دهندگان همچنین میتوانند API زنده چند رسانهای جدید را که دارای ورودی صوتی و ویدیویی در زمان واقعی و قابلیت استفاده از چندین ابزار ترکیبی است، امتحان کنند.
این مدل جدید از طریق تجربه Gemini در دسک تاپ و وب موبایل در دسترس مصرف کنندگان است و به زودی به برنامههای موبایل نیز اضافه خواهد شد. گوگل در ژانویه 2025 در دسترس بودن عمومی Gemini 2.0 Flash را اعلام خواهد کرد.
در کنار Gemini 2.0 Flash، گوگل همچنین چندین نمونه اولیه را معرفی کرد که قابلیتهای عامل گونه Gemini 2.0 را بررسی میکنند.
پروژه Astra اکنون میتواند به چندین زبان و زبانهای ترکیبی گفتگو کند. اکنون دارای حداکثر 10 دقیقه حافظه درون جلسهای است و میتواند از Google Search، Lens و Maps استفاده کند.
پروژه Mariner یک عامل هوش مصنوعی است که میتواند اطلاعات روی صفحه مرورگر شما را درک و استدلال کند تا وظایف را تکمیل کند. گوگل ادعا میکند که پروژه Mariner به عنوان یک تنظیم عامل واحد به نتیجه پیشرفته 83.5٪ دست یافته است.
Jules یک عامل کد مبتنی بر هوش مصنوعی است که مستقیماً با گردش کار GitHub ادغام میشود تا یک مشکل را برطرف کند، یک برنامه توسعه دهد و آن را اجرا کند.
Gemini 2.0 Flash با قابلیتهای چند رسانهای و ادغام ابزار بومی خود، امکانات هیجان انگیزی را برای توسعه دهندگان و مصرف کنندگان به یکسان باز میکند.