OpenAI امروز سری جدیدی از مدل های هوش مصنوعی به نام o1 را معرفی کرد که توانایی استدلال منطقی قوی تری نسبت به مدل های قبلی دارند. یکی از اولین کاربردهایی که برای این مدل های جدید بررسی میشود، بهبود توانایی GitHub Copilot در تحلیل، اصلاح و بهینه سازی کد است.
OpenAI و GitHub برخی از آزمایش های داخلی ادغام مدل جدید o1-preview با Copilot را انجام دادهاند. یکی از این آزمایش ها، استفاده از o1-preview برای بهینه سازی عملکرد یکی از مهمترین اجزای کد در Copilot بود. همانطور که در وبلاگ ذکر شده، این مدل کد را بطور عمیق تجزیه و تحلیل کرده، محدودیت ها و موارد حاشیهای را درک کرده و در یک تلاش، یک راه حل بسیار بهتر پیشنهاد کرده است.
مثال دیگر، مقایسه o1-preview با مدل فعلی، GPT-4o، در رفع یک مشکل عملکرد مرورگر در کد پایه GitHub بود. این اشکال باعث شده بود که یک تابع مدیریت تمرکز کند شود و مرورگر را متوقف کند.
o1-preview توانست این مشکل را شناسایی کرده و در عرض چند دقیقه اصلاحات خط به خط را پیشنهاد کند، در حالی که GPT-4o پاسخ های کمتر هدفمندی ارائه کرد.
نتایج نشان میدهد که توانایی استدلال o1-preview به درک عمیق تر محدودیت ها و موارد حاشیهای کد کمک میکند که منجر به نتیجهای کارآمد تر و با کیفیت تر میشود. در همین حال، GPT-4o به بهینه سازی های آشکار پایبند است و برای هدایت Copilot به سمت رویکردهای پیچیده تر به کمک توسعه دهنده نیاز دارد.
طبق وبلاگ، مدل o1-preview استدلال بهبود یافتهای دارد که پشتیبانی Copilot را برای موارد استفاده بازبینی کد، بازسازی و بهینه سازی که به تجزیه و تحلیل های غنی تر متکی هستند، بهبود خواهد بخشید. این مدل مستقیماً از خروجی کد، معیارها را محاسبه کرده و نتایج را به صورت مختصر ارائه میدهد.
با 1000 عنصر مدیریت شده توسط این کد، جدا کردن مشکل دشوار بود. در نهایت تغییری را پیاده سازی کردیم که زمان اجرای این تابع را از بیش از 1000 میلی ثانیه به حدود 16 میلی ثانیه بهبود بخشید. اگر Copilot را با o1-preview داشتیم، میتوانستیم به سرعت مشکل را شناسایی کرده و آن را سریع تر برطرف کنیم.
OpenAI و GitHub قصد دارند مدل های o1-preview و o1-mini کوچک تر را در GitHub Marketplace ارائه دهند. در حالی که o1-preview همچنان در حالت پیش نمایش است، توسعه دهندگان میتوانند از طریق Azure AI برای دسترسی اولیه درخواست دهند تا با استفاده از مدل های جدید پروژه ها را بسازند.