در ماه سپتامبر، شرکت OpenAI از سری جدید مدلهای زبانی بزرگ خود به نام سری o1 رونمایی کرد که برای اختصاص زمان بیشتری به تفکر پیش از پاسخ طراحی شدهاند. این مدلها برای انجام وظایف پیچیده در زمینه استدلال بسیار مناسب هستند و در حوزههای علمی، کدنویسی و ریاضی عملکرد بهتری دارند.
امروز، شرکت گوگل اولین مدل بزرگ زبانی خود با تمرکز بر استدلال را با نام Gemini 2.0 Flash Thinking معرفی کرد. این مدل آزمایشی جدید تحت عنوان gemini-2.0-flash-thinking-exp-1219 در دسترس توسعه دهندگان در پلتفرم Google AI Studio قرار گرفته است. گوگل ادعا میکند که این مدل جدید برای درک چندحالتی (multimodal)، استدلال و کدنویسی بسیار مناسب است.
گوگل اشاره کرد که با افزایش زمان محاسبه در هنگام استنتاج (inference)، به نتایج امیدوارکنندهای دست یافته است. با این حال، این شرکت هیچ معیاری برای پشتیبانی از این ادعا ارائه نکرد. اما بر اساس دادههای Chatbot Arena، مدل Gemini-2.0-Flash-Thinking اکنون در تمامی دسته بندیها رتبه اول را دارد.
پیشرفت از Gemini-2.0-Flash:
- رتبه کلی: از #3 به #1
- کنترل سبک (Style Control): از #4 به #1
- ریاضی: از #2 به #1
- نگارش خلاقانه: از #2 به #1
- پرسشهای سخت: همچنان #1
موارد استفاده مدل Gemini 2.0 Flash Thinking
گوگل در پورتال توسعه دهندگان خود این موارد استفاده را برای مدل جدید ذکر کرده است:
- تحلیل و استدلال در مسائل بسیار پیچیده
- نمایش فرآیند فکری مدل
- حل مسائل دشوار کدنویسی و ریاضی
این مدل جدید از طول زمینهای بیش از 128 هزار توکن پشتیبانی میکند و دارای برش دانش تا آگوست 2024 است. توسعه دهندگان میتوانند از طریق Gemini API در Google AI Studio و Vertex AI به این مدل استدلالی جدید دسترسی پیدا کنند.
اوایل این هفته، OpenAI اعلام کرد که مدل استدلالی o1 آن برای توسعه دهندگان با سطح دسترسی 5 در API منتشر شده است. این مدل بروز شده o1 نتایج پیشرفتهای را در چندین معیار محبوب هوش مصنوعی ارائه میدهد. توسعه دهندگان میتوانند از این مدل برای ساخت اپلیکیشنهای هوشمند جهت بهبود پشتیبانی مشتری، بهینه سازی تصمیم گیریهای زنجیره تأمین و پیشبینی روندهای مالی استفاده کنند.
با این مدلهای زبانی جدید با تمرکز بر استدلال، توسعه دهندگان ابزارهای قدرتمندتری برای ایجاد اپلیکیشنهای نوآورانه هوش مصنوعی در صنایع مختلف در اختیار دارند.