بنچمارکهای A7 (سیستم-روی-یک-چیپ جدید اپل) نشان از قدرت و بازده بسیار بالای آن دارد. اپل
در پردازنده جدید خود نشان داد که میتواند با همان 2 هسته همیشگی بازده
بالاتری نسبت به پردازندههای 4 هستهای بازار ارائه کند. اما دقیقا درون
A7 چه چیز وجود دارد؟ چرا قدرت و بازده بالاتری را ارائه میکند؟ معماری آن
چگونه است؟
A7 هم مثل اکثر سیستم-روی-یک-چیپهای
بازار از معماری ARM بهره میبرد، پس اپل نیز همچون سامسونگ، کوالکام،
انویدیا و صدها شرکت دیگر گواهی استفاده از معماری آرم را دریافت کرده است.
به گزارش سافتگذر به نقل از زومیت؛ دو نوع گواهی استفاده از معماری ARM وجود دارد. برخی از شرکتها
مانند سامسونگ یا انویدیا هم معماری کلی استفاده از ARM را اخذ میکنند و
هم از معماری پیشنهادی ARM برای هستهها استفاده میکنند و مثلا پردازنده
خود را براساس معماری هسته Cortex A7 یا A15 یا A9 و غیره تولید میکنند.
حال برخی از کمپانیها بخش مربوط به معماری هستههای اصلی را به همراه
معماری پردازنده گرافیکی Mali را از آرم تهیه میکنند و برخی نیز گواهی
استفاده از معماری هستههای آرم را تهیه کرده و سپس از GPU یا واحد پردازش
گرافیکی دیگری در سیستم-روی-یک-چیپ خود بهره میبرند. به عنوان مثال
انویدیا از معماری هسته آرم (Cortex A9, A15 و غیره) در کنار گرافیک ساخت
خود بهره میبرد و سامسونگ نیز در پردازنده اُکتا از CPU با معماری
Cortex-A15 به همراه هستههای گرافیکی طراحی شده توسط Imagination
Technologies استفاده میکند.
اما حالت دیگری نیز وجود دارد که شرکتهایی همچون کوالکام یا اپل (از A6
به بعد) به سمت آن گرایش پیدا کردهاند. اپل یا کوالکام گواهی استفاده از
معماری کلی شرکت آرم را تهیه میکنند ولیکن برای معماری هستهها، خود وارد
عمل شده و هستهی سفارشی خاص خود را طراحی میکنند.
هستههای A6 اپل براساس معماری کلی ARMv7-ISA طراحی شدند و این هستهها
با نام رمز Swift شناخته شدهاند. اپل با هستههای Swift یکی از بهینهترین
سیستم-روی-یک-چیپهای بازار را رونمایی کرد که از نظر قدرت و مصرف باتری
نسبت به A5 که براساس معماری Cortex-A9 ساخته شده بود، بسیار بهتر عمل
میکرد. A6 در واقع ترکیبی از بازده بالا و مصرف انرژی پایین بود و در
محصول موفقی همچون آیفون 5 بکار گرفته شد. در زمان معرفی A6 اپل توانست
عملکرد بهتری نسبت به هستههای طراحی شده کوالکام در آن زمان ارائه کند،
اما کوالکام آرام ننشست و با معرفی هستههای اختصاصی خود با نامهای Krait
300 و Krait 400 که به ترتیب در پردازندههای موفق Snapdragon S600 و
Snapdragion 800 بکار گرفته شده، مجدداً رهبری بازار SoCها را بدست گرفت و
توانست عملکرد بهتری را نسبت به A6 ارایه کند. S600 در گوشیهای رده اولی
همچون HTC One و گلکسی اس 4 به کار گرفته شده و S800 نیز در پرچمدارانی
مثل Xperia Z1، LG G2 و گلکسی نوت 3 دیده میشود. حالا و پس از گذشت 12
ماه، اپل یک SoC دیگر به نام A7 را رونمایی کرده که در بیشتر بنچمارکها
مطلقا بیرقیب است!
هنوز اپل به طور رسمی اطلاعات مربوط به سیستم-روی-یک-چیپ جدید خود را
منتشر ننموده، اما از آنجایی که این محصول به دست مهندسین AnandTech
افتاده، آنها توانستهاند بررسی نسبتاً جامعی روی آن انجام دهند و در نهایت
نتایج جالبی به دست آمده است.
A7 از لیتوگرافی 28 نانومتری HK+MG سامسونگ بهره میبرد. این بدین
معناست که طراحی کلی تراشه توسط اپل و براساس معماری ARMv7 انجام شده، سپس
طرحها در اختیار سامسونگ قرار گرفته تا نسبت به تولید A7 اقدام کند. پس در
این بین سامسونگ تراشه A7 اپل را بدون هیچ دخالتی، تولید کرده است. پیش از
این شایعه شده بود که A7 از فرایند ساخت 20 نانومتری بهره خواهد برد اما
براساس اطلاعات بدست آمده، شرکت TSMC که شریک تجاری جدید اپل است و قرار
است به مرور جایگزین سامسونگ شود، هنوز برای ساخت SoC با لیتوگرافی 20
نانومتری آماده نیست و به همین دلیل اپل از لیتوگرافی 28 نانومتری برای A7
بهره برده است و تولید آن را به سامسونگ واگذار کرده است.
لیتوگرافی 28 نانومتری برای A7 از نظر تئوری نسبت به لیتوگرافی 32
نانومتری، گرمای کمتری تولید میکند و از نظر ابعاد نیز یک تراشه یکسان با
لیتوگرافی 28 نانومتری، نزدیک به 76.5 درصد ابعاد همان تراشه با لیتوگرافی
32 نانومتری را دارد. البته این تخمین به صورت تئوری زده شده و در عمل
نمیتوان همه چیز را به این خوبی کوچک کرد، بنابراین نتیجهی 80 تا 85
درصدی معقولتر است.
اپل در کنفرانی معرفی iPhone 5s اعلام کرد که ابعاد تراشه A7 این شرکت
102 میلیمتر مربع بوده و در آن بیش از 1 میلیارد ترانزیستور جا شده است.
اما آنها اطلاعات بیشتری در معماری داخلی A7 بیان نکردند و باید چند روز
دیگری برای کسب اطلاعات بیشتر صبر کرد.
به هر حال براساس صحبتهای اپل در رابطه با تعداد 1 میلیارد ترانزیستور
میتوان متوجه شد که A7 نزدیک به 2 برابر ترانزیستورهای A6 را در خود جای
داده است. این بدین معناست که لیتوگرافی 28 نانومتری و احتمالاً معماری
متفاوت باعث شده تا علاوه بر کوچک شدن تراشه A7، ترانزیستورهای بیشتری نیز
روی آن جا بگیرند و نهایتاً قدرت و بازده به مراتب بالاتری را ارائه کند.
هستههای بیشتر و فرکانس بالاتر به معنی قدرت و بازده بیشتر نیست!
نکته جالب توجه دیگر در سیستم-روی-یک-چیپ A7 مربوط به فرکانس کاری 2
هستهی آن است؛ این پردازنده با فرکانس 1.29 گیگاهرتز کار میکند که خود
شگفت انگیز است. چون این پردازنده 1.29 گیگاهرتزی بهتر از پردازنده پرقدرت
S800 با 4 هسته 2.3 گیگاهرتز عمل میکند.
همانطور که پیشتر نیز اشاره کردیم، بخش CPU در A7 دارای هستههای
سفارشی خود اپل است. این هستهها احتمالاً شباهتهایی با معماری Cortex A57
شرکت آرم دارند اما هنوز برای صحبت کردن در این باره کمی زود است. به هر
حال اپل باز هم معماری Swift را بهینهتر کرده و برای طراحی هستههای
سفارشی A7 از آن استفاده نموده است.
انند از وب سایت AnandTech معتقد است که گذار از 2 هسته به 4 هسته در
پردازندههای موبایل سریعتر از آنچه انتظار میرفت، رخ داده است.
خوشبختانه نرم افزارهایی وجود دارند که قادر به استفادهی بهینه از 2 هسته و
بیشتر بوده و از تمام توان آنها برای اجرای دستورات مورد نظر کاربر بهره
میبرند. اما همانطور که مثلاً در تلفن Moto X شاهد بودیم، دو هسته
پردازنده این تلفن، به خوبی از پس اجرای سریع امور مختلف بر میآید و به
دلیل استفاده از فرکانس پایین و هستههای کمتر مصرف باتری آن بسیار
بهینهاست. البته پردازندههای 4 هستهای امروزی نیز به کمک کاهش توان
مصرفی هستههای بیکار، به خوبی مصرف انرژی را مدیریت میکنند و مشکل زیادی
ندارند.
انویدیا همه را مجبور کرد تا نسبت به ساخت تراشه 4 هستهای گام بردارند،
شاید کوالکام و دیگر تولیدکنندگان برنامهریزی متفاوتی داشتند و تراشههای
4 هستهای را برای مدتی بعد در برنامهی خود داشتند ولیکن رونمایی
زودهنگام از تگرا 3 باعث شد تا همه مجبور شوند، هر چه سریعتر نسبت به ساخت
SoCهایی با حداقل 4 هسته اقدام نمایند. متأسفانه بسیاری از بازارهای
جهانی، بیش از قدرت هستهها و بازدهی آن به تعداد هستهها پرداختهاند و
مشتریان هم به دنبال اعداد و ارقام بالاتر برای فرکانس کاری پردازنده و
تعداد هستهها هستند. این دقیقاً همان دلیلی است که امروز گجتهای چینی به
پردازندههای ارزان قیمت 4 هستهای از نوع Cortex A5 یا Cortex A7 مجهز
میشوند. این پردازندهها شاید در عمل از یک SoC تک هستهای از نوع Cortex
A15 ضعیفتر باشند، اما کاربران تمایل بیشتری نسبت به خرید ابزارهای مبتنی
بر آنها نشان میدهند. به هر حال اپل بار دیگر با معرفی A7 نشان داد که
فرکانس بالاتر و تعداد هسته بیشتر لزوماً به معنی قدرت و بازده بالاتر
نیست.
اپل باز هم 2 هستهی قدرتمند با فرکانس بهینه را انتخاب کرده است
بهتر است به گفتههای کمپانی آرم استناد کنیم: «فرکانس بهینه برای
هستههای Cortex A15 در یک گوشی هوشمند، 1.2 گیگاهرتز است». در حال حاضر
سامسونگ در تراشهی اکسینوس 5410 خود از هستههای 1.6 گیگاهرتز استفاده
میکند و در 5420 که قلب تپندهی گلکسی نوت 3 است، فرکانس بیشینهی 1.7
گیگاهرتز را انتخاب کرده است. رابطهی بین فرکانس کاری و توان در یک تراشه
حدوداً یک رابطهی مجذوری است به این معنی که که برای فرکانس بیشتر به
ولتاژ بالاتر نیاز داریم و ولتاژ 2 برابر، توان مصرفی 4 برابر را به دنبال
دارد.
اپل در A7 هم مثل A6 از فرکانس ماکسیمم 1.29 گیگاهرتز استفاده کرده است،
یعنی سرعتی مشابه فرکانس حالت پایه در سیستم-روی-یک-چیپهای جدید اینتل با
نام Bay Trail. با اجرای نرمافزارهای مختلف و قرائت فرکانس 2 هستهی
اصلی، همیشه فرکانس ماکسیسمم 1.3گیگاهرتز است. در مورد تعداد هستهها هم
اطمینان داریم که تنها 2 هستهی اصلی در A7 وجود دارد و 2 ترد پردازشی را
اجرا میکنند. در بنچمارک Geekbench 3، تراشهی A7 هم در محاسبات
تکهستهای و هم در محاسبات چند هستهای رکوردها را شکسته است. با توجه به
نتایج مشخص است که در حالت Multi Thread قدرت پردازشی حدود 2 برابر بوده و
با یک تراشهی 2 هستهای سر وکار داریم.
همانطور که گفته شد عملکرد هستههای جدید نسبت به آنچه در A6 یا A6X
تجربه کرده بودیم، بالاتر است. اما نام هستههای جدید چیست؟ آیا اپل باز هم
از عنوان Swift استفاده میکند؟ پاسخ منفی است. Cyclone به معنای گردباد
نام هستههای جدید است. در کنار هستههای پردازندهی اصلی یک پردازندهی
دیگر هم وجود دارد که برای محاسبات مربوط به حرکات در نظر گرفته شده است.
اگر یادتان باشد اپل هنگام رونمایی از آیفون جدید علاوه بر A7 به M7 اشاره
کرده بود که نام همین پردازنده است. M7 نیز هستهای به نام Oscar دارد.
آیا 2 هستهی سایکلون واقعاً گردباد ایجاد میکنند؟
سایکلون یک هستهی کاملاً جدید نیست بلکه بر اساس سویفت شکل گرفته و
طراحی شده است. احتمالاً تبادل داده و به عبارت دیگر پهنای مرز ارتباطی 3
برابر شده و تعداد درگاههای اجرایی بین 5 تا 7 برابر بیشتر است. با توجه
به عملکرد بسیار خوب تراشهی جدید اپل، احتمالاً اجرای خارج از نوبت
دستورات نیز پشتیبانی میشود.
سایکلون از لحاظ معماری بر اساس هستههای 64 بیتی ARMv8 طراحی شده و لذا
معماری مجموعه دستورات یا ISA حاصل کار اپل نیست. اما به هر حال A7 از
تمام رقبای خود در گوشیهای هوشمند سریعتر است و حتی مدلهای مخصوص سرور
آرم نیز توان رقابت با آن را ندارند.
استفاده از ARMv8 مزایای خاصی دارد. رجیسترهای بیشتر، معماری مجموعه
دستورات بهتر، اکستنشنهای بهینهتر برای دستورات چند دادهای (یا SIMD) و
عملکرد بالاتر در این نوع دستورات و در نهایت شتابدهیهای مختلف، همگی در
فهرست مزایا قرار دارند.
احتمالاً طول پایپلاین یا کانال اطلاعات تغییری نکرده و حتی کمی افزایش
یافته چرا که فرکانس کاری تغییری نکرده است. A7 از هیچ افزایش سرعتی که
دمای بالاتری به دنبال دارد، پشتیبانی نمیکند.
بزرگترین تغییری که در اولین تراشهی مبتنی بر ARMv8 اپل شاهد هستیم، 2
برابر شدن حافظهی کش سطح 1 است، کش L1 برای دستور و دادهها به ترتیب 64 و
64 کیلوبایت فضا دارد در حالی که قبلاً از 32 و 32 کیلوبایت استفاده
میشد. تغییر دیگر زمان دسترسی به کش است که از 2 سیکل کلاک به 3 سیکل کلاک
افزایش یافته است و احتمالاً یکی از دلایل آن افزایش دفعات استفاده از کش و
دسترسی به آن است. چنین کش بزرگی بیشتر در معماریهای کمپانی AMD دیده
میشود و در گوشیهای هوشمند رده اول کمسابقه است. کش سطح 1 بزرگتر در
آماده نگه داشتن دستورات و دادهها برای انجام محاسبات، مفید واقع میشود و
نشان از وجود هستههای پردازشی قویتر دارد.
کنترلر حافظهی تراشهی A7 نیز بسیار بهینه شده به طوری که زمان تأخیر
در دستری به حافظه، نسبت به A6 اپل حدود 20 درصد کاهش پیدا کرده است.
پیشگویی کنندهی شاخهها و پیشفراخوانهای حافظه در A7 به مراتب بهتر عمل
میکنند.
در نهایت بیشینهی پهنای باند حافظه است که در A7 نسبت به A6 افزایش
یافته است که توسط بنچمارکهای مختلف و از جمله Geekbench 3 میتوان به آن
پی برد. افزایش پهنای باند در تستهای مختلف بین 6 تا 58 درصد است.
البته ممکن است این بنچمارک تنها پهنای باند حافظه را اندازه نگیرند و
محاسبات اضافی دیگری نیز در نتایج دخیل شوند. در اجرای برخی کدهای خاص،
پهنای باند حافظه رکورد 2 برابری هم ثبت کرده است که با توجه به
بهینهسازیهای انجام شده در مورد کش و واسط حافظه چندان غیر طبیعی به نظر
نمیرسد.
علاوه بر عملکرد بالاتر حافظه و واسط آن، هستهها نیز توانمندتر از A6 هستند، به نتایج Geekbench نگاهی داشته باشیم:
در محاسبات اعداد صحیح یا Integer چه به صورت تکنخی یا ST و چه به
صورت چندنخی یا MT تا 42 درصد افزایش سرعت دیده میشود. در محاسبات اعداد
ممیز شناور یا FP نیز در حالت تکنخی و چندنخی افزایش سرعت 67 درصد است.
البته هنوز از توانمندیهای خاصی که در یک پردازندهی 64 بیتی انتظار
میرود، صحبت نکردیم و در واقع نتایج مربوط به حالت 32 بیتی است. واسط
حافظه پهنای 64 بیت دارد و احتمالاً از حافظهی LPDDR3 با فرکانس بالاتر
استفاده شده است.
در حقیقت مجموعهی نتایج گواه این مطلب است که قدرت پردازشی A7 در زمرهی پردازندههای دستاپ قرار میگیرد.
چرایی مهاجرت اپل به سمت معماری 64 بیتی
قبل از عرضهی آیفون 5S شایعاتی در مورد تراشهی A7 و حرکت اپل به سمت
معماری 64 بیتی شنیده میشد. در ابتدا با توجه به اینکه هیچ یک از رقبا
چنین کاری نکرده بود و دردسرهای زیادی داشت، به نظر میرسید که همهی
شایعات دروغی بیش نیست اما با رونمایی رسمی از آیفون، شایعات رنگ حقیقت
گرفتند.
در دنیای پیسی معماری 64 بیتی چندان بیگانه نیست چرا که ایامدی از
اواسط سال 2000 پردازندههایی با معماری 64 بیت عرضه کرده بود. در آن زمان
علت اصلی مهاجرت به معماری 64 بیتی، پشتیبانی از آدرسدهی گستردهتر حافظه
بود. در معماری 32 بیتی میتوان 2 به توان 32 خانهی حافظه را آدرسدهی کرد
که همان 4 گیگابایت معروف است ولیکن در معماری 64 بیتی میتوان 2 به توان
64 بیت یا به عبارتی 16 اگزابایت را آدرسدهی کرد که رقمی فوقالعاده است.
بنابراین برای استفاده از رمهای بیش از 4 گیگابایت، ویندوز 64 بیتی کاملاً
متداول شده است.
اما در عمل ایامدی تنها از 48 بیت برای آدرسدهی استفاده کرد و به
عبارتی 2 به توان 48 خانهی حافظه یکتا که معادل 256 ترابایت است، آدرسدهی
میشود که شاید هیچ محدودیت خاصی به حساب نیاید.
مسألهی دیگر بهبود پردازش است. در معماری 64 بیتی رجیسترهای بیشتری
قابل استفاده است و لذا x64 نسبت به x86 یا معماری 32 بیتی، بهینهتر است.
در دنیای پردازندههای گوشی و تبلت که بیشتر مبتنی بر طرحهای کمپانی
ARM هستند نیز با توجه به دلایل مطرح شده، تمایل به استفاده از معماری 64
بیتی حس میشد. آرم و شرکای بزرگش به فکر بازار سرورها هستند، بازاری که
اینتل در آن حاکم شده و سود زیادی به دست میآورد. اما مشکل اصلی اینجاست
که برای یک سرور، آدرسدهی مقدار زیادی حافظه و در واقع داشتن معماری 64
بیتی الزامی است. بنابراین چند ماه قبل در مورد رونمایی از اولین
معماریهای 64 بیتی آرم شنیدیم و دو هستهی Cortex A53 و A57 برای محصولات
مختلف معرفی شدند. معماری مجموعه دستورات با همان عنوان ARMv8 شناخته
میشوند که جانشین نسخهی 32 بیتی فعلی یعنی ARMv7 است.
یکی از مسائلی که رقبای اپل و از جمله کوآلکام به آن اشاره کردهاند،
حافظهی کم آیفون و آیپدهای جدید است. همانطور که گفته شد، در معماری 64
بیتی، آدرسدهی گستردهتری وجود دارد ولیکن اپل حافظهی بالایی در محصولات
خود قرار نداده و لذا هدف اصلی اپل، استفاده از سایر مزایای معماری 64 بیتی
بوده است. استفاده از A64 هم مثل استفاده از x86-64 در پیسیها به افزایش
تعداد رجیسترهای همهمنظوره منجر میشود. در معماری مجموعه دستورات ARMv7
به ازای هر شمارندهی برنامه یا Program Counter از 1 رجیستر یا ثبات
استفاده میشود ولیکن در ARMv8 یا اصطلاحاً A64 از 31 رجیستر استفاده شده
که هر یک پهنایی برابر با 64 بیت دارند. همواره دسترسی به تمام 31 رجیستر
وجود دارد.
نمودار زیر حافظهی به کار رفته در آیفونها و آیپدهای اپل را نمایش
میدهد و مشخص است که در آینده، بالاخره حافظهی این محصولات به بیش از 4
گیگابایت خواهد رسید.
افزایش تعداد رجیسترها در یک معماری منجر به کاهش فشار روی رجیسترها و
در نتیجه افزایش عملکرد میشود. به عنوان مثال در دنیای پیسی استفاده از
معماری 64 بیتی یا به عبارتی x86-64 باعث 2 برابر شدن تعداد رجیسترها شده و
عملکرد کلی حدود 10 درصد افزایش یافته است.
استفاده از معماری 64 بیتی در تعداد رجیسترهای ممیز شناور یا NEON نیز
موثر است. این دسته از رجیسترها در انجام محاسبات اعداد اعشاری و کدهای
NEON کاربرد دارند. کدهای NEON برای انجام پردازشهای خاصی مثل مالتیمدیا و
کدکهای صوتی تصویری و پردازش سیگنال و مانند آن، روی سختافزار مناسب
اجرا شده و از رجیسترهای ویژهای استفاده میکنند و در نهایت عملکرد تراشه
در انجام چنین محاسباتی افزایش مییابد. تعداد رجیسترهای ممیز شناوری و
NEON در معماری 64 بیتی، 32 عدد است که دو برابر ARMv7 میباشد.
علاوه بر افزایش تعداد رجیسترها، هر رجیستر به جای 64 بیت از 128 بیت
خانهی حافظه برخوردار است. پشتیبانی از رجیسترهای 128 بیتی در افزایش
عملکرد SIMD یا دستورات چند دادهای، بسیار موثر است. علاوه بر این افزایش
تعداد رجیسترها نیز عملکرد کلی را افزایش میدهد ولیکن بسته به نوع پردازش،
تأثیر دو برابر شدن اندازهی هر رجیستر، به مراتب بیشتر است. در نهایت یک
نوع SIMD پیشرفته نیز در ARMv8 وجود دارد و آن محاسبات ریاضی ممیز شناوری
با دقت دو برابر یا به صورت خلاصه Double precision SIMD FP است.
در معماری مجموعه دستورات ARMv8 چندین دستور جدید برای پشتیبانی از
شتابدهی سختافزاری الگوریتمهای AES، SHA1 و SHA256 وجود دارد. این
دستورات سختافزاری AES . SHA پتانسیل بالایی برای افزایش عملکرد دارند.
درست مثل دستورات AES-NI در پردازندههای اینتل که چند سال پیش عرضه شدند.
در حقیقت دستورات جدید ممیز شناوری با دقت دو برابر و نیز شتابدهی
سختافزاری، موج جدیدی از نرمافزارهای سیستم عامل iOS را به دنبال خواهند
داشت.
دیگر نمیتوان از اپلیکیشنهای قدیمی و 32 بیتی استفاده کرد؟
پاسخ کوتاه به این سوال این است که تقریباً هیچ مشکلی وجود ندارد و نرمافزارهای قدیمی قابل استفاده است.
در دنیای پیسی، مهاجرت به معماری 64 بیتی با اضافه کردن الحاقاتی به
مجموعه دستورات 32 بیتی قبلی امکانپذیر شد ولیکن در دنیای آرم به معماری
جدیدی برای مجموعه دستورات نیاز است. مجموعه دستورات جدید آرم را A64
میگویند و دستورات 32 بیتی قبلی که تا حد زیادی با معماری جدید سازگار است
نیز A32 نام دارد. هر دو مجموعه دستورات را میتوان در یک تراشه به کار
گرفت کرد چرا که ARMv8 دو حالت معماری دارد، AArch32 و AArch64. تراشههایی
که هر دو حالت را به کار ببرند، قادر به تغییر حالت بوده و بسته به شرایط
میتوانند از حالت مناسب استفاده کنند.
بنابراین علیرغم جدید و متفاوت بودن A64، اجرای کدهای قدیمی 32 بیتی
روی آن با مشکل خاصی روبرو نمیشود. به هر حال اپل با تغییرات ناگهانی
بیگانه نیست و لذا این تغییر معماری دور از انتظار نبود. سایر شرکای آرم از
سال آتی به سمت استفاده از ARMv8 حرکت میکنند.
با استفاده از نافعال کردن بیتهای اضافی، تعداد زیادی از دستورات A64
قادر به استفاده از عملوندهای 32 بیتی هستند. استفاده از A32 در معماری
مجموعه دستورات ARMv8 با دستورات جدیدی همراه است. بنابراین میتوان
نرمافزارهای AArch32 را در ARMv8 کامپایل کرد ولیکن نتیجهی کامپایل،
اپلیکیشنی است که با نسخههای قبلی معماری، سازگار نیست. اما بر عکس این
عمل یعنی اجرای کدهایی که برای معماری قدیمیتر و 32 بیتی ARMv7 نوشته شده
بودند با مشکل خاصی روبرو نمیشود.
از منظر نرمافزاری تمام نرمافزارهای اصلی iOS 7 و خود سیستم عامل همگی
به صورت 64 بیتی کامپایل شده و به عبارتی برای AArch64 حاضر شدهاند. در
واقع اگر آیفون 5s را راهاندازی کنیم و وارد سیستم عامل شویم، هیچ پردازشی
برای معماری 32 بیتی اجرا نمیشود و همگی مبتنی بر arm64 هستند.
مرورگر Safari، نرمافزار Mail و تمام نرمافزارهای دیگر برای معماری 64
بیتی بهینه شدهاند. در حقیقت تنها سختافزار نیست که برای اجرای دستورات
64 بیتی آمادگی دارد، نرمافزارهای اصلی و البته محبوب و پرکاربرد iOS 7
برای معماری 64 بیتی کامپایل شدهاند. این هم نمونهی دیگری از مزیت
یکپارچگی عمودی محصولات اپل است که معمولاً در صنعت وسایل الکترونیکی به آن
اشاره میشود، درست مثل استفاده از صفحه نمایش رتینا به همراه معرفی سیستم
عامل OS X که باز هم نوعی یکپارچگی عمودی است.
اجرای نرمافزارهای 32 بیتی و 64 بیتی به موازات هم نیز کاملاً عادی
است. هنگام استفاده از گوشی نمیتوان گفت که محیط اجرای نرمافزارها،
ترکیبی از حالت 32 بیتی و 64 بیتی است یا فقط نرمافزارهای 64 بیتی مشغول
فعالیت هستند. همه چیز کاملاً عادی است و نرمافزارهای 32 و 64 بیتی در
کنار هم اجرا میشوند.
به نظر میرسد که هیچ مشکلی در اجرا و استفاده از نرمافزارهای قدیمی 32
بیتی که برای معماری مجموعه دستورات ARMv7 طراحی شده بودند، وجود ندارد.
در واقع اینطور میتوان استنباط کرد که برای یک کاربر عادی، مهاجرت به
سیستم عامل و سختافزار 64 بیتی به سادگی خرید گوشی آیفون 5s است.
افزایش عملکرد به خاطر استفاده از معماری 64 بیتی
Geekbench یکی از اولین بنچمارکهایی است که برای پشتیبانی از معماری
64 بیتی ARMv8 به روز شده است. تغییرات کوچکی در نسخهی 3.1 این نرمافزار
نسبت به نسخهی 3.0 دیده میشود ولیکن آزمونهای آن به غیر از آزمون حافظه،
تغییری نکرده است. بنابراین میتوان تأثیر دستورات 64 بیتی ARMv8 و دو
برابر شدن تعداد رجیسترها را عملاً بررسی کرد. به عملکرد تراشهی جدید در
انجام محاسبات روی اعداد صحیح نگاهی بیاندازیم و تفاوت حالت 32 و 64 بیتی
یا به عبارت دیگر A32 و A64 را بررسی کنیم:
تغییر 825 و 245 درصدی در سرعت اجرای الگوریتمهای AES و SHA مستقیماً
به خاطر استفاده از دستورات جدیدی است که در معماری مجموعه دستورات ARMv8
وجود دارد. در دنیای پیسی هم معرفی پردازندههای Westmere اینتل با
پشتیبانی از دستورات AES-NI چنین تغییر بزرگی ایجاد کرد. تنها مشکلی که در
نتایج فوق دیده میشود، محاسبات Dijkstra است که در آن عملکرد کاهش یافته
است. علت این است که تغییر اندازهی اشارهگر یا Pointer از 32 بیت به 64
بیت، فشار روی حافظهی کش را بیشتر کرده و عملکرد کاهش یافته است.
ضمناً تغییرات فوق ممکن است کوچک به نظر برسند اما باید این نکته را هم
در نظر گرفت که افزایش عملکرد تراشهی جدید A7 نسبت به A6 نیز به ارقام فوق
اضافه میشود و لذا محصولات جدید، سرعتی به مراتب بیشتر دارند.
محاسبات اعداد صحیح پیشرفت خوبی داشته اما محاسبات اعداد ممیز شناور باز هم بهتر است:
توجه کنید که اعمال DGEMM در ARMv7 پشتیبانی نمیشوند اما در ARMv8 با
توجه به پشتیبانی از دستورات روی اعدادی با دقت دو برابر، افزایش کارایی
بسیار زیاد است. پردازش SFFT که یک تبدیل سریع فوریه است و برای کاربردهایی
مثل محاسبهی اندازهی فرکانسهای مختلف در استریم موسیقی جهت رسم نمودار
گرافیکی ستونهای صدا استفاده میشود نیز به لطف دو برابر شدن فضای
رجیسترها، پیشرفت قابل ملاحظهای کرده است. منظور از نمودار ستونهای صدا،
ترسیمهای با عنوان Spectrum یا چیزی شبیه به آن در پلیرهای صوتی و تصویری
است.
در روش 64 بیتی تعداد دستورات بارگذاری و ذخیرهسازی حدود 30 درصد کمتر از حالت 32 بیتی است و همین موضوع عملکرد را افزایش میدهد.
تراشهی A7 و رابطهی آن با سیستم عامل OS X
چند سال پیش رابطهی اپل و اینتل به دلایل مختلف تیره و تار شد و همیشه
این احتمال وجود داشته که در نهایت، اپل شخصاً تراشههای مکبوکها را
طراحی کند و از پردازندههای اینتلی بهره نگیرد. اما فعلاً رابطهی اپل و
اینتل در عرصهی کامپیوترها بد نیست و فعلاً از تراشههای اینتلی بهره
میبرد. از طرف دیگر قدرت پردازشی پردازندههای فعلی اینتل که خانوادهی
هسول است، بسیار بالاتر از تراشههایی نظیر A7 است و فعلاً نمیتوان روی
قدرت A7 به عنوان قلب تپیندهی یک مک سریع، حساب باز کرد.
در مجموع فعلاً برای ظهور یک تراشهی اپلی که سیستم عامل OS X را روی یک
مک اجرا کند، بسیار زود است و باید چند سال دیگر هم صبر کرد تا شاید اپل
سیستم عامل وسایل همراه و مکبوکهای خود را یکسان کند.
بررسی تراشهی A7 توسط بنچمارکهای عمومی
پلتفرم اندرویدیها و تراشههای مرتبط با آن به کلی با iOS و تراشهی A7
که در آیفون 5s به کار رفته متفاوت است ولیکن بنچمارکهایی مستقل از
سیستم عامل وجود دارد که به کمک آن میتوان عملکرد تراشههای مختلف را
مقایسه نمود. به این منظور ترکیبی از بنچمارکهای مربوط به اجرای
جاوااسکریپت و HTML5 را روی وسایل مختلف اجرا کرده و عملکرد تراشهها را
بررسی میکنیم.
رقبای اصلی تراشهی A7 را تراشههای S800 کوآلکام که مدل دقیق آن
MSM8974 Snapdragon 800 است و Atom Z3770 که در تبلت طراحی شده توسط اینتل
به عنوان طراحی مرجع یا FFRD قرار دارد، تشکیل میدهند. تفاوت بین توان
مصرفی A7 و رقبا چندان زیاد نیست ولی فاصلهی کوچکی وجود دارد. توجه کنید
که منظور از MSM8974 Snapdragon 800 MDP/T تراشهای است که در تبلت خاصی که
کوآلکام برای نمایش قدرت S800 رونمایی کرده، به کار رفته است و از نظر
کارایی و احتمالاً توان مصرفی، کمی بالاتر از سایر محصولات بازار قرار
میگیرد.
در بسیاری از بنچمارکها نتایج کسب شده توسط A7 نسبت به دو رقیب اصلی
خود بهتر است. علاوه بر این با توجه به عملکرد A7 میتوان تخمینی از عملکرد
آیپدهای جدید داشت.
اولین بنچمارک SunSpider است که کدهای جاوااسکریپ را در مرورگر اجرا
میکند و این روزها سازندگان نرمافزار و سختافزار سعی میکنند محصولاتشان
را برای این بنچمارک کوچک و سبک، بهینه کنند. به هر حال این آزمون معیاری
از بهینه بودن مجموعهی حافظه است.
اینتل برای مدت کوتاهی در این آزمون صدرنشین بود و حالا جای خود را به
تراشهی دو هستهای A7 میدهد. A7 حدود 75 درصد سریعتر از تراشهی به کار
رفته در آیفون 5 است و رقیب کوآلکامی خود یعنی S800 را به راحتی مغلوب
کرده است. البته ناگفته نماند که اگر Bay Trail اینتل در مرورگر جدید IE11
فعالیت کند، نتیجه 329.6 میلیثانیه میشود که نسبت به A7 سریعتر است و
همچنان اینتل را در صدر نگه میدارد.
بنچمارک سنگینتر Kraken در اجرای جاوااسکریپت نتایج واقعیتری دارد
چرا که الگوریتمها گستردهتر و بیشتر هستند و نیز کمتر شناخته شده است و
لذا احتمال بهینهسازی سختافزار برای این آزمون کمتر میشود.
باز هم اینتل صدرنشین است و S800 و هستههای Cortex A15 در فرکانس کاری
بیشینهی خود نیز از رقیب اپلی عقب ماندهاند. عملکرد A7 به تراشهی Atom
Z3740 اینتل قرابت بیشتری دارد. در واقع منطقی به نظر میرسد که A7 با سرعت
کلاک 1.4 گیگاهرتز در برابر یک Bay Trail رده متوسط که سرعت مشابهی دارد،
قرار بگیرد. A7 نسبت به تراشهی آیفون قبلی حدود 2.3 سریعتر ظاهر شده است.
آزمون بعدی Google Octane است که باز هم به اجرای جاوااسکریپت
میپردازد. برتری با محصولاتی است که قادر به اجرای مرورگر گوگل کروم باشند
چرا که هدف موتور اجرایی جاوااسکریپت V8 است. بنابراین آیفون 5s فاقد این
مزیت خواهد بود.
باز هم اینتل صدرنشین است. با رونمایی از آیپد 5 باید منتظر نتایج آن
باشیم و ببینیم اینتل چطور با آن رقابت میکند. برتری A7 نسبت به آیفون
قبلی نیز 92 درصد است که بخشی از آن به علت 64 بیتی شدن مرورگر Safari اپل
است.
آخرین آزمون Browsermark 2.0 است که تنها به اجرای جاوااسکریپ محدود
نمیشود بلکه فعالیتهای مختلفی را در مرورگر انجام میدهد و نتیجهی
واقعیتری دارد.
تراکم حول امتیاز 2500 زیاد است و وسایل زیادی با تفاوت اندکی دیده
میشوند. در این میان LG G2 و آیفون 5s به وضوح خود را از رقبا جدا کرده و
امتیازی فراتر از 3200 به دست آوردهاند. البته به خاطر داشته باشید که
پرچمداران امروزی عرصهی اندروید یعنی Galaxy Note 3 سامسونگ و Xperia Z1
سونی هم تراشهی S800 را یدک میکشند و امتیازی شبیه به LG G2 به دست
میآورند.
تفاوت آیفون جدید با نسخهی قبلی در این آزمون به 25 درصد کاهش مییابد.
اینتل دیگر صدرنشین نیست و کوآلکام باز هم یک رقیب جدی محسوب میشود.
معماری پردازندهی گرافیکی در A7 کدام است؟
با نگاهی به گذشتهی آیفونها به این نتیجه میرسیم که در آیفون جدید هم
احتمالاً از طراحیهای کمپانی نامآشنای Imagination Technologies استفاده
شده است که حدس کاملاً درستی است. در سالهای اخیر تمام آیفونها و آیپدها
از بهترین پردازندههای گرافیکی استفاده کردهاند. البته این بار اپل سعی
میکند که جزئیات کامل در مورد پردازندهی گرافیکی آیفون 5s افشا نشود.
قبلاً گمانهزنیها به استفاده از سری 6 پردازندههای گرافیکی PowerVR
اشاره داشتند. با رونمایی از آیفون 5s و نگاهی به فهرست پشتیبانیهای
سختافزاری از واسطهای برنامهنویسی به این نتیجه میرسیم که در آیفون 5s
قطعاً یک مدل پیشرفتهتر از پردازندههای سری 5XT استفاده نشده چرا که هیچ
یک از اعضای این خانواده، از اکستنشنهای نسخهی 3 واسط OpenGL پشتیبانی
نمیکنند. در واقع تنها پردازندههای سری 600 آرم یا Mali 6XX و نیز سری
300 پردازندههای گرافیکی کوآلکام یا همان Adreno 3XX، استفاده از
اکستنشنهای نسخهی 3.0 را پشتیبانی میکنند. لذا با توجه به اینکه A7 یک
تراشهی کوآلکامی نیست و اپل علاقهای به استفاده از طراحیهای گرافیکی آرم
ندارد، به این نتیجه میرسیم که تراشهی A7 در بخش پردازندهی گرافیکی،
یکی از مدلهای سری 6 ایمجینیشن را در خود جای داده است. در ضمن یادآور
میشویم که تگرا 4 انویدیا نیز از اکستنشنهای یاد شده پشتیبانی نمیکند و
هنوز تا رونمایی از نسل بعدی Logan که مبتنی بر معماری Kepler است، زمان
زیادی باقی مانده است.
نکتهی دیگر در مورد پردازندهی گرافیکی آیفون جدید این است که از رندر
به صورت TBDR استفاده میکند. در روش tile-based deferred rendering،
نرمافزار چندضلعیهایی را ایجاد کرده و به درایور پردازندهی PowerVR
ارسال میکند. فعلاً چیزی رندر نمیشود بلکه اطلاعات در حافظه به شکل
اندیسخورده ذخیره میشوند. تفاوت PowerVR با سایر معماریها در این است که
معمولاً تا زمانی که اطلاعات مربوط به تمام چندضلعیها آماده نشده، پردازش
به تعویق میافتد. علاوه بر این فرآیند سنگین تخصیص بافت و سایهزنی
پیکسلها و در واقع بخشهای یک فریم نیز تا زمانی که نمایان شدن یک پیکسل
در فریم مشخص و قطعی نشده، به تعویق میافتد. لذا TBDR یا رندرینگ تعویقی
تکهتکهای، روشی است که تنها در پردازندههای گرافیکی کمپانی ایمجینیشن به
کار رفته است. البته آرم نیز مدعی شده که در سری 600 پردازندههای
گرافیکیاش نیز از این روش استفاده شده است.
اما تفاوت نهایی که مدل پردازندهی گرافیکی استفاده شده را آشکار
میکند، پشتیبانی از anti-aliasing است. منظور از آنتی-الیاسینگ برطرف کردن
شکستگی خطوط در تصویر است.
در تصویر فوق عبارت MAX_SAMPLES = 8 به آنتی-الیاسینگ با روش MSAA (یا
چندنمونهای) با 8 نمونه اشاره دارد. این حالت در سری 600 پردازندههای
گرافیکی آرم پشتیبانی نمیشود چرا که در اسناد اصلی ارائه شده توسط آرم
تنها به دو حالت 4x و 16x اشاره شده است.
نکات دیگری نیز در مورد تراشهی A7 ذکر شده که بر خبر «استفاده از سری 6 پردازندههای گرافیکی ایمجینیشن در A7» مهر تأیید میزنند.
پردازندهی گرافیکی تراشهی A7 تمام محاسبات اعداد ممیز شناور را با یک
پردازندهی اسکالر انجام میدهد، حتی آنهایی که مقدارشان به صورت برداری
شناسایی شده است. استفادهی درست از الگوی نوشتن و تعریف دقیق محاسبات به
افزایش عملکرد شیدرها منجر میشود.
مقادیر کوچک یا متوسط شیدرهای ممیز شناوری، یک جور و به صورت مقادیر 16
بیتی ممیز شناوری محاسبه میشوند. این تغییر به خاطر پردازندههای گرافیکی
PowerVR SGX است که برای مقادیر کمدقت از حالت 10 بیتی با موقعیت ثابت
ممیز استفاده میکنند. اگر شیدر شما متغیرهای ممیز شناوری با دقت پایین
دارد و نیز از سختافزار PowerVR SGX پشتیبانی میکند، باید شیدرهای خود را
روی هر دو پردازندهی گرافیکی تست کنید.
در دو بند فوق دقیقاً به سری 6 اشاره شده چرا که ایمجینیشن در سری 6 به
معماری اسکالر روی آورده است و همچنین در اسناد ایمجینیشن به این مهم اشاره
شده که کمدقتترین حالت برای یکی عدد اعشاری، حالتی متشکل از 16 بیت یا
به عبارت دیگر FP16 است.
بنابراین مسلم است که از سری 6 استفاده شده و لذا در ادامه به بررسی بیشتر سختافزار سری 6 میپردازیم.
در A7 از پردازندهی گرافیکی PowerVR G6430 استفاده شده است
سری 6 پردازندههای گرافیکی ایمجینیشن با نام رمز Rouge با چند پیکربندی به صورت زیر طراحی شدهاند:
با توجه به کارایی A7 در بنچمارکهای گرافیکی میتوان گفت که از
پردازندهی گرافیکی G6430 استفاده شده، آن هم به صورت 4 تایی. طبق جدول فوق
این مدل برای کارایی بهینه شده و مساحت آن در اولویت قرار نگرفته است.
توجه کنید که منظور از 4 تایی، 4 هسته نیست بلکه روش استفاده از چند هسته
در سری 6 متفاوت از نسلهای قبلی است که در ادامه به آن خواهیم پرداخت.
بزرگترین تغییری که در سری 6 نسبت به معماری نسل قبلی یعنی 5XT که در
آیفون 5، آیپد 4 و آیپد مینی شاهد هستیم، استفاده از یک معماری کاملاً
اسکالر است. درست شبیه به پردازندههای گرافیکی که ایامدی و انویدیا برای
پیسیها و لپتاپها طراحی کردهاند.
تفاوت دیگر در نحوهی استفاده از چند پردازندهی گرافیکی در یک تراشه
است. در سری 5XT به پردازندههای چند هستهای اشاره میکردیم و در واقع از
چند هسته با تمام اجزا در یک تراشه استفاده میشد. در سری 6 روش کار کپی
کردن تمام بخشهای یک هسته نیست لذا از اصطلاح چند Cluster استفاده
میشود. در این روش تنها چیزی که کپی میشود، واحدهای محاسبه و منطق شیدر
(یا ALU) و همچنین سختافزار مربوط به بافت است. در نهایت باز هم معماری
نسل 6 یک معماری یکپارچه است با این تفاوت که حالا مرز ارتباطی پردازنده با
واحدهای شیدر که داخل آن هستند، نسبت یک به یک ندارد. از جنبههای مختلفی
میتوان این روش استفاده از چندین پردازنده را معقولتر دانست، همچنان که
در بیشتر موارد برای ایجاد یک پردازندهی گرافیکی قویتر از همین روش
استفاده میشود.
معماری کاملاً اسکالر در پردازندههای گرافیکی Rouge
در نسل قبلی پردازندههای گرافیکی کمپانی ایمجینیشن یا 5XT، هر یک از
هستهها چندین کانال اطلاعات USSE2 داشتند که هر یک قادر به ضرب و جمع
بردار 4 بعدی یا Vec4 بود. 4 بعد یک بردار در این معماری برداری، 4 مقدار
برای 4 رنگ در یک پیکسل است.
علاوه بر اعمال برداری فوق، انجام یک عمل ممیز شناوری نیز امکانپذیر
است که بسته به شرایط ممکن است به صورت دوتایی به صف اعمال تخصیص داده شود.
ایمجینیشن هیچوقت در مورد تخصیص دوتایی، جزئیات را بیان نکرده لذا برای
محاسبهی قدرت پردازنده در انجام محاسبات ممیز شناور یا همان عددی که با
واحد FLOPS بیان میشود، میتوان تعداد اعمال جمع و ضرب یا به عبارت دیگر
تعداد MADهای بردارهای 4 بعدی را شمارش کرد. اگر هر MAD را به صورت دو عمل
ممیز شناوری در نظر بگیریم، در هر کانال اطلاعات USSE2، دقیقاً 4 متغیر و
MAD وجود دارد، در نتیجه 8 عمل ممیز شناوری در یک سیکل کلاک قابل انجام
است. لذا یک USSE2 که ساختار یک دستوری و چند دادهای دارد، تنها یک دستور
را برای هر 4 بعد یا متغیر خود میپذیرد. اگر تعداد MADها 3 عدد باشد، مشخص
میشود که بردار 3 بعدی است و به همین ترتیب در مورد MADهای دو تایی و تکی
میتوان نتیجهگیری کرد.
در مجموع در نسل قبل، با یک دستور چند دادهای، 4 رنگ یک پیکسل محاسبه میشد و به عبارتی 1 پیکسل در هر کلاک پردازش میشد.
در سری 6 یا Rouge به جای USSE2 از گروه یکپارچهی شیدری یا USC استفاده
شده است. هر USC، سختافزاری برای انجام یک دستور چند دادهای با پهنای 16
است. هر بخش قادر به انجام 4 محاسبهی عدد اعشاری32 بیتی در یک سیکل کلاک
است. لذا در یک سیکل کلاک، هر USC با پهنای 16 قادر به انجام 64 محاسبه روی
اعداد اعشاری 32 بیتی خواهد بود. این توان پردازشی معادل 2 هستهی PowerVR
SGX 543 از نسل قبل است. مشخص است که نسل جدید بهینهتر از نسل قبل طراحی
شده و عملکرد بالاتری دارد.
و اما در تراشهی A7 چه میگذرد؟ در A7 از یک گروه 4 تایی استفاده شده
که در مجموع تعداد USCها و توان محاسبات ممیز شناوری 32 بیتی به ترتیب 4
عدد و 256 فلاپس، البته در یک سیکل کلاک میشود. بنابراین اگر سرعت کلاک
200 مگاهرتز باشد، قدرت محاسباتی A7 دو برابر پردازندهی گرافیکی آیفون 5
خواهد بود. با توجه به شایعات سرعت کلاک G6430 به مراتب بیشتر از 200
مگاهرتز است و لذا توان محاسباتی آن بیش از 2 برابر آیفون 5 است.
منظور از معماری تماماً اسکالر در سری 6 این است که 16 پیکسل در یک کلاک
پردازش میشوند به این صورت که یک USC، خود دارای 16 کانال اطلاعات است که
هر کانال در یک سیکل کلاک 4 عمل محاسباتی اعداد اعشاری 32 بیتی را انجام
میدهد و در مجموع 64 عمل ممیز شناوری در یک کلاک صورت میگیرد. با توجه به
اینکه این 64 عمل روی 4 رنگ انجام شده، 16 عمل روی هر یک از 4 رنگ صورت
گرفته و لذا 16 پیکسل در یک سیکل کلاک پردازش میشود.
از طرفی توان محاسباتی A7 بیش از آیپد 4 هست، لذا برای استفاده در آیپد
مینی که صفحه نمایش رتینا دارد هم به اندازهی کافی توانمند است. البته
مشکل پهنای باند حافظه نیز مطرح است که باید حل شود ولیکن قدرت پردازشی A7
بسیار بالا و کافی است.
عملکرد پردازندهی گرافیکی تراشهی A7 در بنچمارکها
همانطور که بحث کردیم، تراشهی A7 اولین تراشهی بازار مصرفکنندگان
است که از پردازندههای گرافیکی نسل 6 کمپانی ایمجینیشن تکنالوجیز بهره
میبرد. G6430 در آیفون 5s چیدمان 4 تایی دارد.
ایمجینیشن بر این باور است که معماری اسکالر جدید بهینهتر و متراکمتر
از معماری نسل قبلی است. البته در بازار پیسی هم استفاده از روش اسکالر در
مورد کارت گرافیکها چنین نتیجهای را به دنبال داشته است و لذا ادعای این
کمپانی کاملاً درست است.
اپل اعلام کرده که قدرت آیفون جدید در محاسبات گرافیکی 2 برابر بیشتر از
نسخهی قبلی است اما با توجه به قدرت محاسبات ممیز شناوری که در جدول زیر
گردآوری شده، به نظر میرسد که قدرت A7 چیزی بیش از 2 برابر A6 باشد.
GFXBench 2.7
اولین آزمون GFXBench 2.7 یا همان GLBenchmark است. بنچمارکی که نسبت
به بازیهای امروزی سنگینتر است و از طرفی بیشتر تولیدکنندگان تراشه از آن
برای آزمایش قدرت تراشههای خود استفاده میکنند و در نهایت معیاری است از
سرعت اجرای بازیها. نرخ پر کردن پیکسل بسیار بالا و دو برابر بیشتر از
آیفون 5 است:
توجه کنید که آزمون فوق در حالت 1080p برای تمام گوشیها صورت گرفته تا
تعداد پیکسلها برابر باشد. در غیر این صورت صفحه نمایش آیفون 5s با
رزولوشن پایینی که دارد، معیار درستی از قدرت A7 نمایش نمیدهد.
نرخ خروجی مثلثها در A7 به دلیل کپی نشدن تمام اجزای یک هسته، قابل قیاس با پردازندهی آیفون 5 نیست:
اما این آزمون چندان در مورد بازیها مهم نیست و در واقع طراحی جدید
تعادل بهتری بین چیدن مثلثها برای پردازش و سپس انجام محاسبات شیدری
برقرار کرده است.
در مورد خروجی مثلثها و روشن کردن بخشها نیز اوضاع بدتر میشود:
لذا بهتر است به بنچمارکهای نزدیکتر به دنیای بازی استناد میکنیم،
اولین بنچمارک T-Rex HD است که در رزولوشن صفحه نمایش هر گوشی اجرا
میشود:
مشخص است که سرعت A7 در اجرای این بنچمارک بیش از 2 برابر آیفون 5 است.
مهمتر از آن اولین گوشیای است که در این آزمون سرعتی بالاتر از 30 فریم
بر ثانیه دارد و لذا بیش از آیفونهای قبلی مورد توجه بازیخورهاست و در
قفسهی فروشگاهها باقی میماند.
در حالت 1080p طبعاً سایر گوشیهایی که صفحه نمایش 1080p دارند، تغییری نمیکنند ولی آیفون 5s با کاهش سرعت مواجه میشود:
مشخص است که LG G2 و سایر گوشیهایی که از تراشهی S800 کوآلکام استفاده
میکنند، کمی کندتر از A7 هستند. البته S800 بسته به شرایط توان مصرفی
ممکن است از A7 سریعتر ظاهر شود و لذا MSM8974 MDP/T را در صدر میبینیم.
بنچمارک سبکتر Egypt HD که به بازیهای امروزی نزدیکتر است هم نتیجهای به صورت زیر دارد:
باز هم تراشهی کوآلکام در صدر قرار گرفته ولیکن توان مصرفی آن احتمالاً در حد آیفون 5s یا LG G2 نیست.
3DMark
در این آزمون فشار روی پردازندهی اصلی به مراتب بیشتر است و از طرفی
مالتیترد بوده و از تراشههای چند هستهای بهرهی بهتری میبرد. استفاده
از CPU در این آزمون گاهاً بیش از 50 درصد است در حالی که در GFXBench بین 6
تا 25 درصد است.
در iOS حالت رزولوشن بالای این آزمون با اصطلاح بینهایت یا Unlimited شناخته میشود که نتایج آن به صورت زیر است:
با توجه به تأثیر پهنای باند حافظه و قدرت پردازندهی اصلی، نتیجه تنها
به توان پردازندهی گرافیکی بستگی ندارد. در آزمون گرافیکی وضعیت کمی
متفاوت میشود:
رتبهی خوب Moto X موتورولا به خاطر هستههای سریع پردازندهی اصلی است و
نشان میدهد که در این آزمون باز هم پردازندهی اصلی بی تأثیر نیست.
در آزمون محاسبات فیزیکی تراشههای چند هستهای موفقتر هستند و سرعت بالاتری دارند:
Basemark X
این بنچمارک هم بسیار پیچیده است و لذا سرعت اجرا بسیار پایین خواهد
بود. متأسفانه به علت وجود باگی نامشخص، اجرای آن در رزولوشن 1080p روی iOS
7 ممکن نیست و نتایج در رزولوشن اصلی گوشیها ارایه میشود:
سرعت تراشهی آیفون جدید باز هم بیش از 2 برابر آیفون قبلی است.