در ماه مه، گوگل مدل جدید Gemini 1.5 Flash را معرفی کرد که برای سرعت و بازدهی بهینه شده است. Gemini 1.5 Flash نسبت به سایر مدل های پیشرفته، از جمله Gemini 1.5 Pro خود گوگل، قیمت رقابتی داشت (0.35 دلار به ازای هر میلیون توکن ورودی و 1.05 دلار به ازای هر میلیون توکن خروجی). ماه گذشته، OpenAI مدل جدید GPT-4o Mini را برای رقابت مستقیم با Gemini 1.5 Flash معرفی کرد و قیمت آن را با 0.15 دلار به ازای هر میلیون توکن ورودی و 0.6 دلار به ازای هر میلیون توکن خروجی، پایین تر از Gemini قرار داد.
امروز، گوگل قیمت مدل Gemini 1.5 Flash را از 12 آگوست 2024 تقریبا 80 درصد کاهش داد. هزینه جدید 0.075 دلار به ازای هر میلیون توکن ورودی و 0.3 دلار به ازای هر میلیون توکن خرودی خواهد بود که باعث میشود Gemini 1.5 Flash تقریباً 50 درصد ارزان تر از GPT-4o mini شرکت OpenAI شود. این کاهش قیمت همراه با ویژگی هایی مانند ذخیره سازی زمینه (context caching) میتواند هزینه و تأخیر پرسش های با زمینه طولانی را به طور قابل توجهی کاهش دهد. فراخوانی های API دسته ای (Batch API calls) نیز میتواند هزینه ها را برای کارهای با تأخیر زیاد further reduce کند (عبارت further reduce کمی تخصصی است، میتوان از عبارت «کاهش بیشتر» استفاده کرد).
از نظر عملکرد، Gemini 1.5 Flash هنوز از GPT-4o mini عقب است. GPT-4o mini در تمام معیارهای برتر هوش مصنوعی به جز MathVista از Gemini 1.5 Flash بهتر عمل می کند.
مدیرعامل گوگل می گوید: «شکست های هوش مصنوعی جمینی گوگل غیرقابل قبول است»
در حالی که کاهش قیمت برای توسعه دهندگان و شرکت ها مفید است، اما برای استارت آپ های کوچک هوش مصنوعی که با غول های صنعت مانند گوگل و OpenAI رقابت می کنند، چالش قابل توجهی ایجاد می کند. استارت آپ هایی که مدل کسب و کار آن ها بر توسعه و ارائه مدل های زبان بزرگ (LLMs) از طریق API متمرکز است، ممکن است در جنگ قیمتی فعلی، ماندگاری و سودآوری خود را با مشکل بیشتری روبرو ببینند. علاوه بر این، انتشار اخیر مدل های پیشرفته LLama 3.1 متن باز متا، رقابت در این حوزه را تشدید میکند. در این بازار در حال تحول، استارت آپ ها برای اطمینان از پایداری بلند مدت خود نیاز به نوآوری یا تمایز قابل توجهی دارند.
همراه با کاهش قیمت، گوگل همچنین اعلام کرد که مدل Gemini 1.5 Flash اکنون می تواند بیش از 100 زبان را درک و به آنها پاسخ دهد. علاوه بر این، در دسترس بودن عمومی توان عملیاتی تخصیص داده شده (provisioned throughput) به توسعه دهندگان اجازه می دهد تا استفاده خود از مدل هایی مانند Gemini 1.5 Flash را مقیاس بندی کنند و اطمینان از ظرفیت و پیش بینی پذیری قیمت را تضمین کند.