شرکت اینتل
در رویداد یک ماه پیشِ محاسبات عملکرد بالای ISC 2016، از پردازندهی Xeon
Phi با نام رمز Knights Landing رونمایی کرد. این پردازنده در اصل در
کنفرانس ابر محاسبه (Supercomputing) در ماه آبان سال قبل معرفی شده بود که
هماکنون فروش آن آغاز شده است.

به گزارش سافت گذر به نقل اززومیت؛ شرکت اینتل در خلال رویداد ISC 2016 یک ماه پیش که مربوط به محاسبات
عملکرد بالا (HPC) است، از پردازندهی Xeon Phi با اسم رمز Knights Landing
رونمایی کرد که در حقیقت در کنفرانس ابر محاسبه (Supercomputing) ماه
آبان سال پیش معرفی شده بود. در حال حاضر، شرکت اینتل فروش این پردازنده
را آغاز کرده است. محصولات Knights Landing شامل بخش سختافزاری اضافی
Omni-Path Fabric اینتل هستند. همچنین، اینتل در این رویداد از نرمافزار
HPC Orchestrator برای مدیریت سیستمهای HPC هم رونمایی کرد.
اینتل اخیرا دوباره تمرکز خود را بر روی رایانههای غیر دسکتاپی شامل
دیتاسنتر (datacenter)، اینترنت اشیا و بازار حافظه گذاشته است. شاید جالب
باشد که بدانید، ۹۹.۲ درصد از سهم بازار سوکتهای CPU دیتاسنترها متعلق به
شرکت اینتل است؛ اما در واقع، توانایی این شرکت به رشد درآمد حاصل از
دیتاسنترها محدود شده است. اینتل صرفا در یک چرخهی بروزرسانی بیپایانی
گیر افتاده که پردازندههای خود را با آهنگ منظمی جایگزین میکند.
در کمال تعجب، منابع مالی مربوط به کل سختافزار سرور، در ۲۰ سال گذشته
رشد محسوسی نداشته است؛ بنابراین دنبال کردن چرخهی بروزرسانی برای رشد
درآمد سودمند نیست. به همین دلیل اینتل در تلاش برای گسترش نفوذ در
دیتاسنتر به وسیلهی هدف قرار دادن بخشهای دارای رشد بالا مانند پردازش
موازی با پردازندههای خانوادهی Xeon Phi که ظاهرا جانشین واحد پردازش
گرافیکی (GPU) خواهد شد، Omni-Path مربوط به شبکه و فناوری 3D NAND یا 3D
XPoint مربوط به حافظه است. راهبرد اینتل تسلط بیشتر بر روی CPU با
استفاده از فریمورک سیستم مقیاسپذیر (SFF) خود که رویکردی همه جانبه برای
معماریهای مقیاس رک (rack-scale) محسوب میشود، است. معماری rack-scale،
رویکردی جدید برای طراحی سختافزار دیتاسنترها است. SSF هم نوعی پیکربندی
برای افزایش کارایی محاسبات با کارایی بالا (HPC) است.
پردازندهی Xeon Phi Knights Landing
خانوادهی پردازندهی Xeon Phi (با تلفظ زیئون فای) که از پروژهی
Larrabee استنتاج شده، برای انجام عملیات محاسباتی موازی سنگین مرتبط با
محاسبات با کارایی بالا (HPC)، یادگیری ماشین، کارهای سنگین مالی و مهندسی
طراحی شده است.

شرکت اینتل به وسیلهی افزودن ویژگی سوکت قابل بوت به دومین نسل از
پردازندههای خانوادهی زئون فی تحت عنوان (Knights Landing (KNL، محصولات
نسل قبلی Knights Corner را توسعه داده است. اولین نسل از محصولات زئون فی،
فقط به صورت کمکپردازندههای PCIe در دسترس بودند. کمکپردازندههای
(Coprocessor) زئون فی در واقع پردازندههای مخصوصی هستند که با بر عهده
گرفتن وظیفهی پردازش محاسبات خاص، در مواقع نیاز به کمک پردازندهی اصلی
میآیند. پردازندههای KNL، در دو نسخهی دارای سختافزار Omni-Path fabric
یکپارچه با پردازنده و بدون این سختافزار اضافی، موجود هستند. نسخهی
دارای سختافزار Omni-Path fabric به وسیلهی اتصال دهنده (connector)
بیرون زده از نسخهی دیگر قابل تفکیک است. پردازندههای KNL، در قالب LGA
3647 سوکت P که دارای دهانهای برای مطابقت با کانکتور Omni-Path fabric
است، ارائه میشوند. Omni-Path یک مولفهای کلیدی برای فریمورک سیستم
مقیاسپذیر است؛ بنابراین یکپارچگی عمیق درون پلتفرم KNL، به پیشبرد اهداف
rack-scale اینتل کمک خواهد کرد.

پردازندهی نسل KNL اولین CPU قابل بوتی است که به طور خاص برای بارِ
کاری موازی طراحی شده است. به علاوه، این نسل اولین پردازندهی یکپارچه با
چیپ کنترلی اضافی Omni-Path fabric (به چیپ کنترلی اضافی در کانکتور توجه
کنید)، یکپارچه با حافظههای با پهنای باند بالا (HBM) و دارای واحدهای
برداری AVX-512 است.
شرکت اینتل ادعا میکند که پردازندههای KNL با از بین بردن تنگناهای
PCIe، دارای حداکثر کارایی ۵ برابری، ۸ برابر کارایی بیشتر در هر وات و ۹
برابر کارایی بیشتر بر هر دلار نسبت به رهکارهای مبتنیبر GPU هستند. این
نتایج حاصل از آزمایشهای داخلی شرکت اینتل است و طبق اظهار این شرکت، به
دلیل دسترسی محدود به نمونه، برخی از این نتایج با پردازندههای مبتنیبر
GPU نسل قبلی به دست آمده است.

پردازندهی ۱۴ نانومتری KNL دارای بیش از ۸ میلیارد ترانزیستور و دارای
ویژگی ابتکاری معماری ۷۲ هستهای است. معماری یاد شده به ۳۶ کاشی ۲
هستهای که در یک پیکربندی شبکهای (mesh) بازآرایی شدهاند، تقسیم میشود.
هر هستهی مبتنیبر Silvermont (سیلورمونت ) ۴ ترِدی (رشتهی پردازشی)،
دارای ۲ عدد VPU (واحد پردازش برداری) AVX-512 از مجموع ۱۴۴ واحد پردازش
برداری است. هر خانهی کاشی، ۱ مگابایت حافظهی کش L2 به اشتراک گذاری شده
دارد که با این اوصاف کل حافظهی کش L2، برابر با ۳۶ مگابایت خواهد شد.
پردازندههای KNL دارای کارایی تک رشتهای ۳ برابری نسبت به محصولات
Knights Crossing نسل قبلی هستند.
پردازندهی KNL دارای حافظه با پهنای باند بالای DRAM چند کاناله
(MCDRAM) شرکت میکرون با ظرفیت ذخیرهسازی ۱۶ گیگابایتی هستند که توان
عملیاتی ۵۰۰ گیگابایت بر ثانیهای را فراهم میکند. این میزان از توان
عملیاتی به سبب اطلاعات بروز شده، ۱۰۰ گیگابایت بر ثانیه بیشتر از عدد
موجود در اسلاید نشان داده شده به وسیلهی اینتل است. هشت بستهی HBM شرکت
میکرون به عنوان یک لایهی حافظهی سریع عمل میکنند. پلتفرم KNL دارای سه
مدل از عملکرد حافظهی رم شامل کش (cache)، ترکیبی (hybrid) و تخت (flat)
را فراهم میکند. این پردازنده از حداکثر حافظهی ۳۸۴ گیگابایتی DDR4 که
روی ۶ کانال (تقریبا ۹۰ گیگابایت بر ثانیه) گسترده شده و اتصال به میکروچیپ
PCH ولزبرگ (Wellsburg) از طریق یک اتصال DMI (رابط رسانهای مستقیم) چهار
مسیری، پشتیبانی میکند. مرکز کنترل کنندهی پلتفرم (PCH) یکی از
خانوادههای میکروچیپ اینتل بوده و رابط رسانهای مستقیم (DMI)، اتصال
اختصاصی اینتل بین چیپست پل شمالی و پل جنوبی در مادربردهای قدیمی است.
سختافزار یکپارچهی Omni-Path fabric یاد شده، از طریق درگاه PCIe x16
به die متصل شده و یک لولهی انتقالی دو درگاهی ۱۰۰ گیگابیت بر ثانیهای
برای ترافیک شبکه فراهم میکند. این پردازنده همچنین دارای ۳۶ مسیر PCIe
3.0 است. پردازندهی KNL، دارای اتصال QPI (اتصال نقطه به نقطه یا مسیر
سریع) برای کاربردهای چند سوکتی نیست. این اتصال از خوشهبندی داخلی مختلف
یا مدلهای عملیاتی دارای طراحی حافظه دسترسی غیر یکپارچه (NUMA) پشتیبانی
میکند. پردازندههای سوکتی قابل بوت هستند در حالی که کارتهای PCIe
اینگونه نیستند.

شرکت اینتل خانوادهی Knights Landing پردازندهی زئون فی خود را در ۴
مدل اصلی عرضه میکند؛ هر چند که ممکن است در آینده مدلهای بیشتری هم
معرفی شوند. در ظاهر تفاوت اصلی بین هر مدل صرفا در سرعت کلاک و تعداد
هستهی پردازشی است. با این حال، مدل سطح پایین 7210 دارای محدودیت پهنای
باند در هردو حافظهی استاندارد DRAM و HBM است. اینتل پیشبینی میکند که
مدل 7210، با برخورداری از ۸۰ الی ۸۵ درصد از کارایی مدل سطح بالای 7290 با
نصف هزینه، محبوبترین محصول خواهد بود. شرکت اینتل در حال حاضر ۱۰۰۰۰۰
واحد از این پردازندهها را یا به فروش رسانده یا سفارش فروش آن را گرفته
است. همچنین اینتل قبل از انتشار رسمی، این پردازندهها را برای یک
اکوسیستم متشکل از ۳۲ شرکت تولید کنندهی اصلی (OEM) و ۳۰ سازندهی مستقل
نرمافزار (ISV) تدارک دیده است.

اینتل ادعا میکند که پلتفرم KNL، توان عملیاتی ۳ ترافلاپسی اضافی در
حالت ممیز شناور دو دقتی (double-precision) یا ۶ ترافلاپس اضافی در حالت
ممیز شناور تک دقتی (single-precision) به ازای گره واحد سوکت، ارائه
میدهد. فلاپس واحد اندازهگیری سرعت پردازش دادهها به وسیلهی رایانه
بوده که هر ترافلاپس معادل یک تریلیارد (یا ۱۰ به توان ۱۲) عملیات ممیز
شناور بر واحد ثانیه است. منظور از single-precision، اعدادی باینری هستند
که ۳۲ بیت از حافظهی رایانه را اشغال کرده و دامنهی پویایی وسیعی از
مقادیر را با استفاده از ممیز شناور ارائه میدهند. حالت double-precision
هم مشابه با single-precision بوده که ۶۴ بیت از حافظهی رایانه را اشغال
میکند. همچنین، شرکت اینتل عملکرد خاصی را در پردازندهی KNL فراهم کرده
که مربوط به واحدهای پردازش گرافیکی (GPU) برای استفاده در یادگیری ماشین
است.
الگوریتمهای یادگیری ماشین به دو دستهی عمومی آموزش و استنباط تقسیم
میشوند. در جایی که کاربران به طور معمول واحدهای پردازش گرافیکی (GPU)،
مدارهای مجتمع دیجیتال قابل برنامهریزی (FPGA) و به میزان کمتر، مدارهای
مجتمع با کاربرد خاص (ASIC) را برای اداره کردن بار سنگین به کار میگیرند،
دستهی مربوط به آموزش نسبت به استنباط، تمرکز بیشتری بر روی محاسبه
دارد. در حال حاضر، بیشتر شرکتها مانند گوگل که اخیرا واحد پردازش تنسور
(ASIC توسعه داده شده برای یادگیری ماشین) را پس از توسعهی دقیق در پلتفرم
FPGA معرفی کرد، از ASIC استفاده میکنند. هزینهی بالای ASIC باعث میشود
که فقط در کاربردهای فرا مقیاسی از آنها استفاده شود. هماکنون شرکت
اینتل خانوادهی پردازندهی زئون فی Knights Landing خود را به عنوان
پردازندهای همه کاره و جایگزینی مقرون به صرفه در اختیار این شرکتها قرار
میدهد.
نکتهی قابل توجه دیگر در مورد معماریهای مبتنیبر ASIC، این است که به
طور ثابت و یکنواخت برای تحریک کردن آنها نیازمند نوعی از محاسبه هستیم.
اینتل معتقد است که پردازندهی KNL قابل بوت میتواند در کاهش هزینه و
پیچیدگی معماری ترکیب شدهی ASIC با زئون کمک کند.
اینتل دارای
پایگاه تامین کنندهی FPGA است. به دست آوردن شرکت آلترا (Altera) برای
آوردن FPGA روی سطح die (سطح سیلیکونی، که ترانزیستورها بر روی آن قرار
دارند) با برخی از محصولات مبتنیبر زئون، میتواند کمال مطلوب نمونهها را
در آینده تغییر دهد. اینتل معتقد است که پردازندهی KNL به عنوان یک عامل
کلیدی در ایجاد تفاوت، جایگاه منحصر به فردی برای به چالش کشیدن GPUها در
اعمال آموزشی و بازاریابی توانایی مقیاسپذیری و کارایی دارد. اینتل اشاره
کرد که GPUها به جای معماریهای محاسبهی سنگین در چند گره که KNL آدرسدهی
میکند، اغلب به محاسبهی سنگین در یک گره منفرد محدود هستند.
با این حال، پردازندهی Tesla P100 شرکت انویدیا
که به تازگی معرفی شده میتواند توانایی مقیاسپذیری بیشتری در
معماریهای رسمی مبتنیبر PCIe چند گره ارائه دهد. جای تعجب نیست که اینتل
معتقد است، خانوادهی زئون بهترین تناسب را با عملهای استنباطی سبک وزن
دارد.
Omni Path و فریمورک سیستم مقیاسپذیر (SSF)
شرکت اینتل یک بروزرسانی در اکوسیستم Omni Path ارائه داده است که
هماکنون شامل بیش از ۸۰۰۰۰ گره است (۲۰ الی ۲۵ درصد از تجارت قابل
آدرسدهی به وسیلهی اینتل). طبق اظهار شرکت اینتل، گسترش اکوسیستم Omni
Path با فروش Xeon Phi مشترک است و آنها پیشبینی میکنند که یکپارچه شدن
اتصال (کانکشن) دو درگاه ۱۰۰ گیگابیت بر ثانیهای درون یک بستهی KNL، باعث
افزایش سرعت این روند خواهد شد.

در نهایت، شرکت اینتل نرمافزار سیستمی HPC Orchestrator را معرفی کرد
که برپایهی OpenHPC بوده و متن باز است؛ اما به وسیلهی اینتل پشتیبانی و
مدیریت میشود. این محصول، نصب، مدیریت و نگهداری مداوم از سیستمهای
محاسباتی عملکرد بالا را بسیار ساده میکند. محصول پیش تکمیل، پیش تست و
تایید اعتبار نشده در حال حاضر در دست آزمایش به وسیلهی ترکیبکنندهها،
سازندگان مستقل نرمافزار (ISV) و محققان مراکز محاسبات با کارایی بالا
(HPC) بوده و در سه ماههی چهارم امسال منتشر خواهد شد.