در دسامبر گذشته، گوگل اولین بار مدل Gemini 2.0 Flash را معرفی کرد که در مقایسه با مدل Gemini 1.5 Pro در معیارهای کلیدی عملکرد بهتری دارد و همچنین دو برابر سریعتر است. مدل Gemini 2.0 Flash از ورودیهای چندرسانهای مانند تصاویر، ویدیو و صدا و همچنین خروجیهای چندرسانهای مانند متن، تصاویر و صدا پشتیبانی میکند.
امروز، گوگل اعلام کرد که مدل Gemini 2.0 Flash به مدل پیشفرض برای تمام کاربران اپلیکیشن Gemini در وب و موبایل تبدیل میشود. در چند هفته آینده، گوگل همچنان مدلهای قدیمیتر Gemini 1.5 Flash و 1.5 Pro را ارائه خواهد داد تا کاربران بتوانند به گفتگوهای قبلی خود ادامه دهند.
پاتریک کین، یکی از اعضای تیم Gemini، در مورد در دسترس بودن Gemini 2.0 Flash نوشت:
اپلیکیشن Gemini اکنون از مدل Gemini 2.0 Flash استفاده میکند. این مدل پاسخهای سریعی ارائه میدهد و عملکرد قویتری در چندین معیار کلیدی دارد و کمکهای روزمرهای در انجام کارهایی مانند طوفان فکری، یادگیری یا نوشتن فراهم میکند.
اپلیکیشن Gemini اکنون شامل Imagen 3، مدل پیشرفته تولید تصویر گوگل است که میتواند تصاویر دقیقتری بر اساس ورودی متنی با جزئیات و بافتهای غنیتر ایجاد کند. کاربران Gemini و Gemini Advanced میتوانند به سادگی تصاویری را که میخواهند ایجاد کنند، با استفاده از متن توصیف کنند و Gemini میتواند تصویر ایجاد شده توسط هوش مصنوعی را ارائه دهد. با این حال، کاربران Gemini Advanced میتوانند تصاویری شامل افراد نیز ایجاد کنند.
به همراه در دسترس بودن مدل جدید Gemini Flash 2.0، کاربران Gemini Advanced به یک پنجره متنی ۱ میلیون توکنی دسترسی خواهند داشت که به آنها اجازه میدهد تعداد زیادی فایل را بارگذاری کنند و به ویژگیهای جدیدی مانند تحقیق عمیق و بیشتر دسترسی اولویتدار داشته باشند.
توسعهدهندگان اکنون میتوانند به مدل Gemini 2.0 Flash از طریق AI Studio و Vertex AI دسترسی پیدا کنند. API جدید Multimodal Live از ورودی صوتی، ویدیو استریمینگ در زمان واقعی و توانایی استفاده از چندین ابزار ترکیبی پشتیبانی میکند. با انتشار مدل Gemini 2.0 Flash و Imagen 3، گوگل به ادامه ارائه قابلیتهای پیشرفته هوش مصنوعی به کاربران و توسعهدهندگان ادامه میدهد.