این مقایسه از اطلاعات ارائه شده توسط NVIDIA جمع‌آوری شده است. تمام GPUهای NVIDIA از محاسبات عمومی (GPGPU) پشتیبانی می کنند، اما همه GPU ها عملکرد مشابهی ندارند یا ویژگی‌های مشابهی ندارند. GPUهای سری GeForce (به خصوص GTX Titan) ممکن است برای کسانی که از برنامه‌های کاربردی مبتنی بر GPU استفاده می‌کنند، جذاب باشد. با این حال، عاقلانه است که تفاوت بین محصولات را در نظر داشته باشید. ویژگی‌های زیادی در GPUهای حرفه‌ای Tesla و Quadro وجود دارد.

محاسبات ممیز شناور دقت مضاعف (64 بیتی) FP64

بسیاری از برنامه‌ها نیاز به محاسبات ریاضی با دقت بالا دارند. در این برنامه‌ها داده‌ها با مقادیر دو برابر بزرگتر (استفاده از 64 بیت به جای 32 بیت) نشان داده می‌شوند. این مقادیر بزرگتر (64 بیتی) دقت مضاعف (double-precision) نامیده می‌شود. مقادیر کوچکتر (32 بیتی) دقت ساده (single-precision) نامیده می شود. اگر چه تقریبا تمام محصولات GPU NVIDIA از محاسبات ساده و مضاعف پشتیبانی می‌کنند، اما عملکرد اکثر پردازنده‌های GeForce در محاسبات با دقت مضاعف به طور قابل توجهی پایین‌تر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت مضاعف بین GPUهای GeForce و Tesla / Quadro آورده شده است:

NVIDIA GPU ModelDouble-precision (64bit) Floating Point Performance
Geforce GTX Titan X Maxwellتا 0.206 TFLOPS
Geforece GTX 1080 Tiتا 0.355 TFLOPS
Geforce Titan Xpتا 0.380 TFLOPS
Geforce Titan Vتا 6.875 TFLOPS
Tesla K801.87+ TFLOPS
Tesla P1004.7 الی 5.3 TFLOPS
Quadro GP1005.2 TFLOPS
Tesla V1007 الی 7.8 TFLOPS
Quadro GV1007.4 TFLOPS

محاسبات ممیز شناور دقت نیمه (16 بیتی) FP16

آموزش شبکه‌های عصبی برای هوش مصنوعی (AI) و یادگیری عمیق (Deep Learning) به طور معمول نیاز به دقت بالا ندارد. در حقیقت، این صنعت در هنگام آموزش شبکه‌های عصبی از عملیات “دقت نیمه” (Half- precision) 16 بیتی استفاده می‌کند. داشتن پردازنده‌های گرافیکی با عملکرد بالا FP16 برای سرعت بخشیدن به آموزش شبکه‌های جدید بسیار مهم است. پشتیبانی از عملیات FP16 از GPUهای سری “پاسکال” آغاز شد. اگرچه تمام GPUهای سری پاسکال و بعد از آن، از FP16 پشتیبانی می‌کنند، اما عملکرد کارتهای گرافیک طراحی شده برای بازی به طور قابل توجهی پایینتر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت نیمه بین GPUهای GeForce و Tesla / Quadro آورده شده است:

NVIDIA GPU ModelHalf-precision (16bit) Floating Point Performance
Geforce GTX Titan X MaxwellN/A
Geforece GTX 1080 Tiکمتر از 0.177 TFLOPS
Geforce Titan Xpکمتر از 0.190 TFLOPS
Geforce Titan V110 TFLOPS
Tesla K80N/A
Tesla P10018.7 الی 21.2 TFLOPS
Quadro GP10020.7 TFLOPS
Tesla V100112 الی 125 TFLOPS
Quadro GV100118.5 TFLOPS

برای تحیه سرور ایستاده جی چی یو و برای تحیه سرور با پردازنده گرافیکی از محصولات سورین می توانید استفاده کنید. همچنین می توانید به کلاستر جی پی یو با پردازنده گرافیکی انویدیا دسترسی پیدا کنید.

تشخیص و اصلاح خطا

در کارتهای گرافیکی که برای اجرای یک بازی کامپیوتری استفاده می‌شوند، خطای حافظه به طور معمول مشکلی ایجاد نمی‌کند (به عنوان مثال، ممکن است رنگ یک پیکسل در یک فریم نادرست باشد). حتی بسیار بعید است کاربر از مسئله آگاه شود. با این حال، برنامه‌های کاربردی محاسباتی فنی به دقت داده‌هایی که توسط GPU ارائه می‌شوند، تکیه می‌کنند. برای بعضی از برنامه های کاربردی، تنها یک خطا می‌تواند منجر به نادرست شدن نتیجه شبیه‌سازی شود. GPUهای Titan قابلیت تشخیص یا اصلاح خطا را ندارند. نه GPU و نه سیستم نمی‌توانند کاربر را از اشتباهاتی رخ داده، مطلع کنند. وظیفه شناسایی خطاها بر عهده کاربر است. چنین امری غیر معمول نیست. پردازنده های NVIDIA Tesla قادر به اصلاح خطاهای تک بیتی و شناسایی و هشدار خطاهای دو بیتی هستند. در GPUهای جدید Tesla V100، Tesla P100 و Quadro GP100، پشتیبانی از ECC در حافظه اصلی HBM2، همچنین در رجیستر فایلها، حافظه های مشترک، حافظه پنهان L1 و حافظه L2 وجود دارد.

ضمانت نامه و توافق کاربر نهایی

گارانتی NVIDIA در محصولات GeForce به صراحت بیان می‌کند که محصولات GeForce برای نصب در سرور طراحی نشده است. نصب GPU‌های GeForce در یک سیستم سرور، ضمانت نامه GPU را باطل می‌کند و ریسک ناشی از آن بر عهده کاربر است. از وب سایت گارانتی NVIDIA:

“این محصول فقط برای استفاده مصرف کننده نهایی ضمانت شده است و برای استفاده در مرکز داده و  یا استفاده در کلاسترهای تجاری (استفاده حرفه‌ای) در نظر گرفته نشده است. هر گونه استفاده از محصول ضمانت شده برای استفاده تجاری موجب لغو این ضمانت می‌گردد.”

کارایی حافظه GPU

برنامه های کاربردی محاسباتی (Computationally-intensive) نیاز به واحدهای محاسباتی با کارایی بالا دارند، اما دسترسی سریع به داده ها نیز حیاتی است. برای بسیاری از برنامه‌های کاربردی HPC، افزایش توان  محاسباتی کافی نخواهد بود، مگر اینکه عملکرد حافظه نیز بهبود یابد. به همین دلیل، در دنیای واقعی، پردازنده‌های Tesla عملکرد بهتری را نسبت به پردازنده‌های GeForce ارائه می‌دهند:

NVIDIA GPU ModelGPU Memory bandwidth
Geforce GTX Titan X Maxwell336 GB/s
Geforece GTX 1080 Ti484 GB/s
Geforce Titan Xp548 GB/s
Geforce Titan V653 GB/s
Tesla K80480 GB/s
Tesla P40346 GB/s
Tesla P100 12GB549 GB/s
Tesla P100 16GB732 GB/s
Quadro GP100717 GB/s
Tesla V100 16GB/32GB900 GB/s
Quadro GV100870 GB/s

میزان حافظه GPU

به طور کلی، حافظه بیشتر موجب عملکرد سریعتر سیستم می‌شود. برای بعضی از برنامه‌های کاربردی HPC حتی امکان یک اجرا به تنهایی وجود ندارد، مگر اینکه حافظه کافی وجود داشته باشد. برای کاربردهای دیگر، کیفیت و موثق بودن نتایج در گرو در دسترس بودن حافظه کافی خواهد بود. پردازنده‌های Tesla  دو برابر پردازنده‌های گرافیکی GeForce حافظه ارائه می دهند:

NVIDIA GPU ModelGPU Memory Quality
Geforece GTX 1080 Ti11GB
Geforce Titan Xp12GB
Geforce Titan V12GB
Tesla K8024GB
Tesla P4024GB
Tesla P100 12GB or 16GB
Quadro GP10016GB
Tesla V10016GB or 32GB
Quadro GV10032GB

بخش دوم این مقایسه را هفته دیگر منتشر خواهیم کرد و در آن PCI در برابر NVLink، پشتیبانی نرم‌افزارهای کاربردی، پشتیبانی سیستم‌عامل، چرخه عمر محصول، کارایی توان مصرفی، موتور DMA، GPU Direct RDMA، Hyper-Q و نظارت و مدیریت توانایی‌های GPU را بررسی خواهیم کرد

قسمت دوم مقایسه پردازنده‌های گرافیکی (GPU) NVIDIA Tesla/Quadro با NVIDIA GeForce (2/2) >>>

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید