مقایسه پردازنده‌های گرافیکی GPU NVIDIA Tesla/Quadro با NVIDIA GeForce 1/2

این مقایسه از اطلاعات ارائه شده توسط NVIDIA جمع‌آوری شده است. تمام GPUهای NVIDIA از محاسبات عمومی (GPGPU) پشتیبانی می کنند، اما همه GPU ها عملکرد مشابهی ندارند یا ویژگی‌های مشابهی ندارند. GPUهای سری GeForce (به خصوص GTX Titan) ممکن است برای کسانی که از برنامه‌های کاربردی مبتنی بر GPU استفاده می‌کنند، جذاب باشد. با این حال، عاقلانه است که تفاوت بین محصولات را در نظر داشته باشید. ویژگی‌های زیادی در GPUهای حرفه‌ای Tesla و Quadro وجود دارد.

محاسبات ممیز شناور دقت مضاعف (64 بیتی) FP64

بسیاری از برنامه‌ها نیاز به محاسبات ریاضی با دقت بالا دارند. در این برنامه‌ها داده‌ها با مقادیر دو برابر بزرگتر (استفاده از 64 بیت به جای 32 بیت) نشان داده می‌شوند. این مقادیر بزرگتر (64 بیتی) دقت مضاعف (double-precision) نامیده می‌شود. مقادیر کوچکتر (32 بیتی) دقت ساده (single-precision) نامیده می شود. اگر چه تقریبا تمام محصولات GPU NVIDIA از محاسبات ساده و مضاعف پشتیبانی می‌کنند، اما عملکرد اکثر پردازنده‌های GeForce در محاسبات با دقت مضاعف به طور قابل توجهی پایین‌تر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت مضاعف بین GPUهای GeForce و Tesla / Quadro آورده شده است:

NVIDIA GPU Model	Double-precision (64bit) Floating Point Performance
Geforce GTX Titan X Maxwell	تا 0.206 TFLOPS
Geforece GTX 1080 Ti	تا 0.355 TFLOPS
Geforce Titan Xp	تا 0.380 TFLOPS
Geforce Titan V	تا 6.875 TFLOPS
Tesla K80	1.87+ TFLOPS
Tesla P100	4.7 الی 5.3 TFLOPS
Quadro GP100	5.2 TFLOPS
Tesla V100	7 الی 7.8 TFLOPS
Quadro GV100	7.4 TFLOPS

محاسبات ممیز شناور دقت نیمه (16 بیتی) FP16

آموزش شبکه‌های عصبی برای هوش مصنوعی (AI) و یادگیری عمیق (Deep Learning) به طور معمول نیاز به دقت بالا ندارد. در حقیقت، این صنعت در هنگام آموزش شبکه‌های عصبی از عملیات “دقت نیمه” (Half- precision) 16 بیتی استفاده می‌کند. داشتن پردازنده‌های گرافیکی با عملکرد بالا FP16 برای سرعت بخشیدن به آموزش شبکه‌های جدید بسیار مهم است. پشتیبانی از عملیات FP16 از GPUهای سری “پاسکال” آغاز شد. اگرچه تمام GPUهای سری پاسکال و بعد از آن، از FP16 پشتیبانی می‌کنند، اما عملکرد کارتهای گرافیک طراحی شده برای بازی به طور قابل توجهی پایینتر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت نیمه بین GPUهای GeForce و Tesla / Quadro آورده شده است:

NVIDIA GPU Model	Half-precision (16bit) Floating Point Performance
Geforce GTX Titan X Maxwell	N/A
Geforece GTX 1080 Ti	کمتر از 0.177 TFLOPS
Geforce Titan Xp	کمتر از 0.190 TFLOPS
Geforce Titan V	110 TFLOPS
Tesla K80	N/A
Tesla P100	18.7 الی 21.2 TFLOPS
Quadro GP100	20.7 TFLOPS
Tesla V100	112 الی 125 TFLOPS
Quadro GV100	118.5 TFLOPS

برای تحیه سرور ایستاده جی چی یو و برای تحیه سرور با پردازنده گرافیکی از محصولات سورین می توانید استفاده کنید. همچنین می توانید به کلاستر جی پی یو با پردازنده گرافیکی انویدیا دسترسی پیدا کنید.

تشخیص و اصلاح خطا

در کارتهای گرافیکی که برای اجرای یک بازی کامپیوتری استفاده می‌شوند، خطای حافظه به طور معمول مشکلی ایجاد نمی‌کند (به عنوان مثال، ممکن است رنگ یک پیکسل در یک فریم نادرست باشد). حتی بسیار بعید است کاربر از مسئله آگاه شود. با این حال، برنامه‌های کاربردی محاسباتی فنی به دقت داده‌هایی که توسط GPU ارائه می‌شوند، تکیه می‌کنند. برای بعضی از برنامه های کاربردی، تنها یک خطا می‌تواند منجر به نادرست شدن نتیجه شبیه‌سازی شود. GPUهای Titan قابلیت تشخیص یا اصلاح خطا را ندارند. نه GPU و نه سیستم نمی‌توانند کاربر را از اشتباهاتی رخ داده، مطلع کنند. وظیفه شناسایی خطاها بر عهده کاربر است. چنین امری غیر معمول نیست. پردازنده های NVIDIA Tesla قادر به اصلاح خطاهای تک بیتی و شناسایی و هشدار خطاهای دو بیتی هستند. در GPUهای جدید Tesla V100، Tesla P100 و Quadro GP100، پشتیبانی از ECC در حافظه اصلی HBM2، همچنین در رجیستر فایلها، حافظه های مشترک، حافظه پنهان L1 و حافظه L2 وجود دارد.

ضمانت نامه و توافق کاربر نهایی

گارانتی NVIDIA در محصولات GeForce به صراحت بیان می‌کند که محصولات GeForce برای نصب در سرور طراحی نشده است. نصب GPU‌های GeForce در یک سیستم سرور، ضمانت نامه GPU را باطل می‌کند و ریسک ناشی از آن بر عهده کاربر است. از وب سایت گارانتی NVIDIA:

“این محصول فقط برای استفاده مصرف کننده نهایی ضمانت شده است و برای استفاده در مرکز داده و یا استفاده در کلاسترهای تجاری (استفاده حرفه‌ای) در نظر گرفته نشده است. هر گونه استفاده از محصول ضمانت شده برای استفاده تجاری موجب لغو این ضمانت می‌گردد.”

کارایی حافظه GPU

برنامه های کاربردی محاسباتی (Computationally-intensive) نیاز به واحدهای محاسباتی با کارایی بالا دارند، اما دسترسی سریع به داده ها نیز حیاتی است. برای بسیاری از برنامه‌های کاربردی HPC، افزایش توان محاسباتی کافی نخواهد بود، مگر اینکه عملکرد حافظه نیز بهبود یابد. به همین دلیل، در دنیای واقعی، پردازنده‌های Tesla عملکرد بهتری را نسبت به پردازنده‌های GeForce ارائه می‌دهند:

NVIDIA GPU Model	GPU Memory bandwidth
Geforce GTX Titan X Maxwell	336 GB/s
Geforece GTX 1080 Ti	484 GB/s
Geforce Titan Xp	548 GB/s
Geforce Titan V	653 GB/s
Tesla K80	480 GB/s
Tesla P40	346 GB/s
Tesla P100 12GB	549 GB/s
Tesla P100 16GB	732 GB/s
Quadro GP100	717 GB/s
Tesla V100 16GB/32GB	900 GB/s
Quadro GV100	870 GB/s

میزان حافظه GPU

به طور کلی، حافظه بیشتر موجب عملکرد سریعتر سیستم می‌شود. برای بعضی از برنامه‌های کاربردی HPC حتی امکان یک اجرا به تنهایی وجود ندارد، مگر اینکه حافظه کافی وجود داشته باشد. برای کاربردهای دیگر، کیفیت و موثق بودن نتایج در گرو در دسترس بودن حافظه کافی خواهد بود. پردازنده‌های Tesla دو برابر پردازنده‌های گرافیکی GeForce حافظه ارائه می دهند:

NVIDIA GPU Model	GPU Memory Quality
Geforece GTX 1080 Ti	11GB
Geforce Titan Xp	12GB
Geforce Titan V	12GB
Tesla K80	24GB
Tesla P40	24GB
Tesla P100	12GB or 16GB
Quadro GP100	16GB
Tesla V100	16GB or 32GB
Quadro GV100	32GB

بخش دوم این مقایسه را هفته دیگر منتشر خواهیم کرد و در آن PCI در برابر NVLink، پشتیبانی نرم‌افزارهای کاربردی، پشتیبانی سیستم‌عامل، چرخه عمر محصول، کارایی توان مصرفی، موتور DMA، GPU Direct RDMA، Hyper-Q و نظارت و مدیریت توانایی‌های GPU را بررسی خواهیم کرد

قسمت دوم مقایسه پردازنده‌های گرافیکی (GPU) NVIDIA Tesla/Quadro با NVIDIA GeForce (2/2) >>>

مقایسه پردازنده‌های گرافیکی GPU NVIDIA Tesla/Quadro با NVIDIA GeForce 1/2

دیدگاه خود را ثبت کنید

دیدگاهتان را بنویسید لغو پاسخ

درباره ما

محصولات

تکنولوژی و برند

نمادها و مجوزها