در رویداد کلود نکست هفته گذشته، گوگل اعلام کرد که مدل Gemini 2.5 Flash به زودی با بهبودهای چشمگیری عرضه خواهد شد. امروز، گوگل از راهاندازی نسخه پیشنمایش Gemini 2.5 Flash در Gemini API از طریق Google AI Studio و Vertex AI خبر داد. این مدل جدید همچنین برای کاربران Gemini از طریق انتخاب مدل (model picker) در دسترس است و میتواند همراه با Canvas برای اصلاح آسان اسناد و کدها استفاده شود.

پس از مدل قبلی خود، یعنی Gemini 2.0 Flash، مدل Gemini 2.5 Flash با پیشرفتهای قابل توجهی در قابلیتهای استدلالی عرضه شده است، بدون آنکه هزینه یا تأخیر زیادی به همراه داشته باشد. گوگل ادعا میکند که این مدل جدید دارای نسبت عملکرد به هزینه عالی است. جزئیات قیمتگذاری به شرح زیر است:
-
۰.۱۵ دلار به ازای هر ۱ میلیون توکن ورودی
-
۰.۶۰ دلار به ازای هر ۱ میلیون توکن خروجی بدون استدلال
-
۳.۵۰ دلار به ازای هر ۱ میلیون توکن خروجی با استدلال
این نسخه اولیه از 2.5 Flash است، اما در مقایسه با 2.0 Flash پیشرفتهای چشمگیری را نشان میدهد.
در صورت نیاز، میتوانید قابلیت استدلال را بهطور کامل خاموش کنید و از این مدل بهعنوان جایگزینی مستقیم برای 2.0 Flash استفاده نمایید.
این مدل در سراسر Gemini API، AI Studio، Vertex و اپلیکیشن Gemini در دسترس است!
Gemini 2.5 Flash اولین مدل ترکیبی کاملاً استدلالی گوگل است که به توسعهدهندگان امکان میدهد قابلیت استدلال را روشن یا خاموش کنند. گفته میشود این ویژگی به توسعهدهندگان کمک میکند تا پاسخهای خود را با توجه به کیفیت هدف، هزینه و تأخیر بهینهسازی کنند. معیارهای عملکرد این مدل جدید را در ادامه مشاهده کنید.
قیمتگذاری Gemini 2.5 Flash
همانطور که در جدول بالا مشاهده میشود، علیرغم هزینه کم، Gemini 2.5 Flash در مقایسه با مدلهای پیشرفته Anthropic و Grok عملکرد قابلقبولی دارد. مدل o4-mini که اخیراً توسط OpenAI منتشر شده است، به نظر میرسد عملکرد بهتری نسبت به نسخه پیشنمایش Gemini 2.5 Flash دارد، اما هزینه آن بهمراتب بیشتر است.