در ماه ژانویه (دی ماه)، مایکروسافت برنامههای خود را برای آوردن نسخههای بهینهشده برای NPU (واحد پردازش عصبی) مدل DeepSeek-R1 به طور مستقیم به کامپیوترهای Copilot+ که از پردازندههای Qualcomm Snapdragon X قدرت میگیرند، اعلام کرد. در ماه فوریه (بهمن ماه)، DeepSeek-R1-Distill-Qwen-1.5B برای اولین بار در AIToolkit برای VSCode در دسترس قرار گرفت.

امروز، مایکروسافت در دسترس بودن مدلهای تقطیر شده (فشرده شده) DeepSeek R1 7B و 14B را برای کامپیوترهای Copilot+ از طریق Azure AI Foundry اعلام کرد. قابلیت اجرای مدلهای 7B و 14B به صورت محلی (روی خود دستگاه) در کامپیوترهای Copilot+ به توسعهدهندگان این امکان را میدهد تا انواع جدیدی از برنامههای کاربردی مبتنی بر هوش مصنوعی را بسازند که قبلاً امکانپذیر نبود.
از آنجایی که این مدلها روی NPUها اجرا میشوند، کاربران میتوانند انتظار قدرت محاسباتی پایدار هوش مصنوعی را با تأثیر کمتری بر عمر باتری و عملکرد حرارتی کامپیوتر خود داشته باشند. همچنین، CPU (واحد پردازش مرکزی) و GPU (واحد پردازش گرافیکی) آنها برای انجام وظایف دیگر در دسترس خواهند بود.
مایکروسافت تاکید کرد که از Aqua، یک ابزار کوانتیزاسیون (کاهش دقت محاسبات برای افزایش سرعت) خودکار داخلی، برای کوانتیزه کردن تمام نسخههای مدل DeepSeek به وزنهای int4 استفاده کرده است. متاسفانه، سرعت تولید توکن (واحد کلمه در پردازش زبان) مدل نسبتاً پایین است. مایکروسافت سرعت تنها 8 توکن در ثانیه را برای مدل 14B و نزدیک به 40 توکن در ثانیه را برای مدل 1.5B گزارش میدهد. مایکروسافت اشاره کرد که در حال کار بر روی بهینهسازیهای بیشتر برای بهبود سرعت است. همانطور که مایکروسافت به بهینهسازی عملکرد ادامه میدهد، انتظار میرود تأثیر این مدلها بر کامپیوترهای Copilot+ به طور قابل توجهی افزایش یابد.
توسعهدهندگان علاقهمند میتوانند نسخههای 1.5B، 7B و 14B مدلهای DeepSeek را از طریق افزونه AI Toolkit VS Code در کامپیوترهای Copilot+ دانلود و اجرا کنند. مدل DeepSeek در فرمت ONNX QDQ بهینه شده است و مستقیماً از Azure AI Foundry دانلود میشود. این مدلها همچنین در آینده به کامپیوترهای +Copilot که از پردازندههای Intel Core Ultra 200V و AMD Ryzen قدرت میگیرند، خواهند آمد.
این حرکت مایکروسافت نشاندهنده تلاشی برای دستیابی به قابلیتهای هوش مصنوعی قدرتمندتر روی دستگاه است که امکانات جدیدی را برای برنامههای کاربردی مبتنی بر هوش مصنوعی فراهم میکند.