هفته گذشته، OpenAI از GPT-4.5، بزرگترین مدل پیشرفته خود تا به امروز رونمایی کرد. OpenAI ادعا کرد که GPT-4.5 داناترین مدل تاکنون است و با گسترش بیشتر فرآیند پیشآموزش ساخته شده است. علاوه بر داشتن دانش بیشتر، مدل GPT-4.5 در مقایسه با مدلهای قدیمیتر OpenAI، مهارتهای نوشتاری بهبود یافته و شخصیت پالایش شدهتری دارد.

امروز، مدل GPT-4.5 در Chatbot Arena با کسب رتبه اول در اکثر دستهبندیها معرفی شد. GPT-4.5 در دستههای زیر صدرنشین شد و در بخش چند گفتگویی (Multi-Turn) پیشتازی مشخصی داشت. GPT-4.5 همچنین در جدول ردهبندی کنترل سبک پیشتاز است:
- چند گفتگویی
- پرامپتهای دشوار
- کدنویسی
- ریاضیات
- نوشتن خلاقانه
- پیروی از دستورالعملها
- پرسشهای طولانیتر
جدیدترین مدل Grok-3 شرکت xAI (grok-3-preview-02-24) نیز در جدول ردهبندی Arena با کسب رتبه اول در پرامپتهای دشوار (انگلیسی) و مشترکاً رتبه اول کلی، و همچنین در کدنویسی، ریاضیات، نوشتن خلاقانه، پیروی از دستورالعملها و پرسشهای طولانیتر معرفی شد. پیشرفتهای سریع نشان داده شده توسط GPT-4.5 و Grok-3 نشاندهنده رقابت فزاینده در فضای هوش مصنوعی است.
Chatbot Arena GPT-4.5 شرکت OpenAI در چندین معیار سنجش هوش مصنوعی دیگر نیز رتبه اول را کسب کرده است. در معیار سنجش بازی حذفی رتبه اول را به دست آورد. بازی حذفی یک تورنمنت چند نفره است که مدلهای زبانی بزرگ را در استدلال اجتماعی، استراتژی و فریب آزمایش میکند. در ردهبندی نمره آزمون IQ، GPT-4.5 عملکرد بهتری نسبت به تمام مدلهای غیر استدلالی دیگر در صنعت داشت. در معیار سنجش نرخ توهم SimpleQA، GPT-4.5 کمترین امتیاز را در میان تمام مدلهای زبانی بزرگ OpenAI کسب کرد.
ماه گذشته، سام آلتمن مدیرعامل OpenAI فاش کرد که GPT-4.5 آخرین مدل غیر زنجیرهای تفکر OpenAI است. علاوه بر این، OpenAI دیگر o3 را به عنوان یک مدل مستقل منتشر نخواهد کرد. در عوض، OpenAI مدلهای سری o و سری GPT را با ایجاد سیستمهایی که میتوانند زمان تفکر مناسب را بر اساس پرسش کاربر تعیین کنند، یکپارچه خواهد کرد.
سام آلتمن همچنین تأیید کرد که حتی کاربران رایگان ChatGPT به GPT-5 دسترسی خواهند داشت، اما تحت تنظیمات هوش استاندارد. مشترکین ChatGPT Plus قادر خواهند بود GPT-5 را در سطح بالاتری از هوش اجرا کنند، در حالی که مشترکین Pro میتوانند GPT-5 را در سطح حتی بالاتری از هوش اجرا کنند. علاوه بر این، مدل یکپارچه از تمام ویژگیهای موجود ChatGPT مانند صدا، بوم نقاشی، جستجو، تحقیق عمیق و موارد دیگر پشتیبانی خواهد کرد.