گوگل از Gemma 3 رونمایی کرده است، جدیدترین بهروزرسانی در مجموعه مدلهای هوش مصنوعیاش، و ادعاهای جسورانهای را مطرح میکند. به گفته این شرکت، این قدرتمندترین مدل هوش مصنوعی است که میتوانید روی یک GPU واحد اجرا کنید.

یک سال پیش، گوگل دو مدل اول Gemma را منتشر کرد که به عنوان نسخههای سبک وزن هوش مصنوعی Gemini طراحی شده بودند. Gemma 3 در همان مسیر ادامه میدهد، از بیش از 35 زبان پشتیبانی میکند و از پیش برای بیش از 140 زبان آموزش دیده است و در پلتفرمهای مختلف، از دستگاههای تلفن همراه تا ایستگاههای کاری با کارایی بالا، کار میکند.
گوگل آن را “بهترین مدل تک شتابدهنده جهان” مینامد و ادعا میکند که هنگام اجرا روی تنها یک GPU، از رقبایی مانند Llama فیسبوک، DeepSeek و OpenAI پیشی میگیرد. تستهای عملکرد در تابلوی امتیازات LMArena نشان میدهد که از رقبایی مانند Llama-405B، DeepSeek-V3 و o3-mini پیشی میگیرد.
این مدل برای GPU های Nvidia و سخت افزار اختصاصی هوش مصنوعی بهینه شده است، و آن را به ویژه برای محققان و توسعه دهندگانی که خواهان عملکرد بالا بدون هزینههای زیرساختی بالا هستند، کارآمد میکند. یکی از نکات برجسته، رتبهبندی از Chatbot Arena است که نشان میدهد Gemma 3 به امتیاز Elo بالایی دست یافته است، در حالی که فقط به یک GPU Nvidia H100 نیاز دارد.
یکی از ارتقاهای کلیدی در Gemma 3، پنجره متنی 128 هزار توکنی گسترش یافته آن است که به آن اجازه میدهد مقادیر زیادی از اطلاعات را پردازش و درک کند. رمزگذار بصری آن اکنون از تصاویر با وضوح بالا و فرمتهای غیر مربعی پشتیبانی میکند و سازگاری آن را با وظایف مختلف پردازش بصری افزایش میدهد. برای کسانی که میخواهند عمیقتر به قابلیتهای این مدل بپردازند، گوگل یک گزارش فنی منتشر کرده است.
گوگل همچنین ShieldGemma 2 را معرفی کرده است، یک طبقهبندیکننده ایمنی تصویر جدید که برای فیلتر کردن محتوای صریح، خطرناک یا خشونتآمیز طراحی شده است. این یک افزودنی مهم است، به خصوص که تصاویر تولید شده توسط هوش مصنوعی رایجتر میشوند.
برای تشویق به پذیرش Gemma، گوگل همچنان به توسعهدهندگان اعتبار Google Cloud ارائه میدهد، در حالی که محققان دانشگاهی میتوانند از طریق برنامه آکادمیک Gemma 3 برای 10000 دلار اعتبار درخواست دهند. فرم درخواست از امروز باز میشود و به مدت چهار هفته باز خواهد ماند.