شرکت Anthropic امروز از مدل بروز شده Claude 3.5 Sonnet و مدل جدید Claude 3.5 Haiku رونمایی کرد. مدل بروز شده Claude 3.5 Sonnet بهبودهایی در تمامی زمینهها ارائه میدهد و در زمینه کدنویسی پیشرفتهای قابل توجهی داشته است. Claude 3.5 Haiku پاسخ Anthropic به مدلهای GPT-4o Mini از OpenAI و Gemini 1.5 Flash از گوگل است. این مدل با قیمت مشابه نسخه قبلی خود اما با بهبودهای عملکردی قابل توجه در دسترس خواهد بود.
بهبودهای Claude 3.5 Sonnet:
- نمره تأیید شده SWE-bench از ۳۳.۴٪ به ۴۹.۰٪ افزایش یافته است که بهترین نمرهای است که تاکنون توسط هر مدل در صنعت به دست آمده است.
- نمره TAU-bench در حوزه خرده فروشی از ۶۲.۶٪ به ۶۹.۲٪ و در حوزه هواپیمایی از ۳۶.۰٪ به ۴۶.۰٪ افزایش یافته است.
- نمرات GPQA و MMLU Pro به ترتیب به ۶۵٪ و ۷۸٪ رسیدهاند که بهتر از مدل Gemini 1.5 Pro است.
مدل Claude 3.5 Haiku
مدل جدید Claude 3.5 Haiku در بسیاری از شاخصهای هوش مصنوعی از مدل Claude 3 Opus، بزرگترین مدل نسل قبلی Anthropic، پیشی میگیرد. Claude 3.5 Haiku نمره ۴۰.۶٪ را در SWE-bench Verified به دست آورده که بهتر از مدل اصلی Claude 3.5 Sonnet و OpenAI GPT-4 Turbo است. این مدل در ابتدا فقط به صورت متنی در دسترس خواهد بود و پشتیبانی از تصاویر بعداً ارائه خواهد شد.
Anthropic همچنین تأکید کرد که آزمایشهای پیش استقرار مشترک مدل جدید Claude 3.5 Sonnet توسط موسسه ایمنی هوش مصنوعی ایالات متحده (US AISI) و موسسه ایمنی بریتانیا (UK AISI) بهعنوان بخشی از توافقی که اوایل امسال امضا شده، انجام شده است. طبق سیاست مقیاس گذاری مسئولانه آنها، مدل بروز شده Claude 3.5 Sonnet تحت استاندارد ASL-2 قرار دارد.
مدل بروز شده Claude 3.5 Sonnet اکنون با همان قیمت برای تمامی توسعه دهندگان از طریق API Anthropic، Amazon Bedrock و Vertex AI گوگل در دسترس است. مدل جدید Claude 3.5 Haiku در پایان این ماه عرضه خواهد شد.
عملکرد بهبود یافته و قیمت مناسب این مدلهای جدید Claude 3.5 آنها را به گزینههای جذابی برای توسعه دهندگان و کسب و کارها تبدیل کرده است که به دنبال مدلهای پیشرفته زبان برای برنامههای هوش مصنوعی خود هستند.