مقایسه پردازندههای گرافیکی GPU NVIDIA Tesla/Quadro با NVIDIA GeForce 1/2
این مقایسه از اطلاعات ارائه شده توسط NVIDIA جمعآوری شده است. تمام GPUهای NVIDIA از محاسبات عمومی (GPGPU) پشتیبانی می کنند، اما همه GPU ها عملکرد مشابهی ندارند یا ویژگیهای مشابهی ندارند. GPUهای سری GeForce (به خصوص GTX Titan) ممکن است برای کسانی که از برنامههای کاربردی مبتنی بر GPU استفاده میکنند، جذاب باشد. با این حال، عاقلانه است که تفاوت بین محصولات را در نظر داشته باشید. ویژگیهای زیادی در GPUهای حرفهای Tesla و Quadro وجود دارد.
محاسبات ممیز شناور دقت مضاعف (64 بیتی) FP64
بسیاری از برنامهها نیاز به محاسبات ریاضی با دقت بالا دارند. در این برنامهها دادهها با مقادیر دو برابر بزرگتر (استفاده از 64 بیت به جای 32 بیت) نشان داده میشوند. این مقادیر بزرگتر (64 بیتی) دقت مضاعف (double-precision) نامیده میشود. مقادیر کوچکتر (32 بیتی) دقت ساده (single-precision) نامیده می شود. اگر چه تقریبا تمام محصولات GPU NVIDIA از محاسبات ساده و مضاعف پشتیبانی میکنند، اما عملکرد اکثر پردازندههای GeForce در محاسبات با دقت مضاعف به طور قابل توجهی پایینتر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت مضاعف بین GPUهای GeForce و Tesla / Quadro آورده شده است:
NVIDIA GPU Model | Double-precision (64bit) Floating Point Performance |
---|---|
Geforce GTX Titan X Maxwell | تا 0.206 TFLOPS |
Geforece GTX 1080 Ti | تا 0.355 TFLOPS |
Geforce Titan Xp | تا 0.380 TFLOPS |
Geforce Titan V | تا 6.875 TFLOPS |
Tesla K80 | 1.87+ TFLOPS |
Tesla P100 | 4.7 الی 5.3 TFLOPS |
Quadro GP100 | 5.2 TFLOPS |
Tesla V100 | 7 الی 7.8 TFLOPS |
Quadro GV100 | 7.4 TFLOPS |
محاسبات ممیز شناور دقت نیمه (16 بیتی) FP16
آموزش شبکههای عصبی برای هوش مصنوعی (AI) و یادگیری عمیق (Deep Learning) به طور معمول نیاز به دقت بالا ندارد. در حقیقت، این صنعت در هنگام آموزش شبکههای عصبی از عملیات “دقت نیمه” (Half- precision) 16 بیتی استفاده میکند. داشتن پردازندههای گرافیکی با عملکرد بالا FP16 برای سرعت بخشیدن به آموزش شبکههای جدید بسیار مهم است. پشتیبانی از عملیات FP16 از GPUهای سری “پاسکال” آغاز شد. اگرچه تمام GPUهای سری پاسکال و بعد از آن، از FP16 پشتیبانی میکنند، اما عملکرد کارتهای گرافیک طراحی شده برای بازی به طور قابل توجهی پایینتر است. در اینجا مقایسۀ عملکرد محاسبات ممیز شناور دقت نیمه بین GPUهای GeForce و Tesla / Quadro آورده شده است:
NVIDIA GPU Model | Half-precision (16bit) Floating Point Performance |
---|---|
Geforce GTX Titan X Maxwell | N/A |
Geforece GTX 1080 Ti | کمتر از 0.177 TFLOPS |
Geforce Titan Xp | کمتر از 0.190 TFLOPS |
Geforce Titan V | 110 TFLOPS |
Tesla K80 | N/A |
Tesla P100 | 18.7 الی 21.2 TFLOPS |
Quadro GP100 | 20.7 TFLOPS |
Tesla V100 | 112 الی 125 TFLOPS |
Quadro GV100 | 118.5 TFLOPS |
برای تحیه سرور ایستاده جی چی یو و برای تحیه سرور با پردازنده گرافیکی از محصولات سورین می توانید استفاده کنید. همچنین می توانید به کلاستر جی پی یو با پردازنده گرافیکی انویدیا دسترسی پیدا کنید.
تشخیص و اصلاح خطا
در کارتهای گرافیکی که برای اجرای یک بازی کامپیوتری استفاده میشوند، خطای حافظه به طور معمول مشکلی ایجاد نمیکند (به عنوان مثال، ممکن است رنگ یک پیکسل در یک فریم نادرست باشد). حتی بسیار بعید است کاربر از مسئله آگاه شود. با این حال، برنامههای کاربردی محاسباتی فنی به دقت دادههایی که توسط GPU ارائه میشوند، تکیه میکنند. برای بعضی از برنامه های کاربردی، تنها یک خطا میتواند منجر به نادرست شدن نتیجه شبیهسازی شود. GPUهای Titan قابلیت تشخیص یا اصلاح خطا را ندارند. نه GPU و نه سیستم نمیتوانند کاربر را از اشتباهاتی رخ داده، مطلع کنند. وظیفه شناسایی خطاها بر عهده کاربر است. چنین امری غیر معمول نیست. پردازنده های NVIDIA Tesla قادر به اصلاح خطاهای تک بیتی و شناسایی و هشدار خطاهای دو بیتی هستند. در GPUهای جدید Tesla V100، Tesla P100 و Quadro GP100، پشتیبانی از ECC در حافظه اصلی HBM2، همچنین در رجیستر فایلها، حافظه های مشترک، حافظه پنهان L1 و حافظه L2 وجود دارد.
ضمانت نامه و توافق کاربر نهایی
گارانتی NVIDIA در محصولات GeForce به صراحت بیان میکند که محصولات GeForce برای نصب در سرور طراحی نشده است. نصب GPUهای GeForce در یک سیستم سرور، ضمانت نامه GPU را باطل میکند و ریسک ناشی از آن بر عهده کاربر است. از وب سایت گارانتی NVIDIA:
“این محصول فقط برای استفاده مصرف کننده نهایی ضمانت شده است و برای استفاده در مرکز داده و یا استفاده در کلاسترهای تجاری (استفاده حرفهای) در نظر گرفته نشده است. هر گونه استفاده از محصول ضمانت شده برای استفاده تجاری موجب لغو این ضمانت میگردد.”
کارایی حافظه GPU
برنامه های کاربردی محاسباتی (Computationally-intensive) نیاز به واحدهای محاسباتی با کارایی بالا دارند، اما دسترسی سریع به داده ها نیز حیاتی است. برای بسیاری از برنامههای کاربردی HPC، افزایش توان محاسباتی کافی نخواهد بود، مگر اینکه عملکرد حافظه نیز بهبود یابد. به همین دلیل، در دنیای واقعی، پردازندههای Tesla عملکرد بهتری را نسبت به پردازندههای GeForce ارائه میدهند:
NVIDIA GPU Model | GPU Memory bandwidth |
---|---|
Geforce GTX Titan X Maxwell | 336 GB/s |
Geforece GTX 1080 Ti | 484 GB/s |
Geforce Titan Xp | 548 GB/s |
Geforce Titan V | 653 GB/s |
Tesla K80 | 480 GB/s |
Tesla P40 | 346 GB/s |
Tesla P100 12GB | 549 GB/s |
Tesla P100 16GB | 732 GB/s |
Quadro GP100 | 717 GB/s |
Tesla V100 16GB/32GB | 900 GB/s |
Quadro GV100 | 870 GB/s |
میزان حافظه GPU
به طور کلی، حافظه بیشتر موجب عملکرد سریعتر سیستم میشود. برای بعضی از برنامههای کاربردی HPC حتی امکان یک اجرا به تنهایی وجود ندارد، مگر اینکه حافظه کافی وجود داشته باشد. برای کاربردهای دیگر، کیفیت و موثق بودن نتایج در گرو در دسترس بودن حافظه کافی خواهد بود. پردازندههای Tesla دو برابر پردازندههای گرافیکی GeForce حافظه ارائه می دهند:
NVIDIA GPU Model | GPU Memory Quality |
---|---|
Geforece GTX 1080 Ti | 11GB |
Geforce Titan Xp | 12GB |
Geforce Titan V | 12GB |
Tesla K80 | 24GB |
Tesla P40 | 24GB |
Tesla P100 | 12GB or 16GB |
Quadro GP100 | 16GB |
Tesla V100 | 16GB or 32GB |
Quadro GV100 | 32GB |
بخش دوم این مقایسه را هفته دیگر منتشر خواهیم کرد و در آن PCI در برابر NVLink، پشتیبانی نرمافزارهای کاربردی، پشتیبانی سیستمعامل، چرخه عمر محصول، کارایی توان مصرفی، موتور DMA، GPU Direct RDMA، Hyper-Q و نظارت و مدیریت تواناییهای GPU را بررسی خواهیم کرد
قسمت دوم مقایسه پردازندههای گرافیکی (GPU) NVIDIA Tesla/Quadro با NVIDIA GeForce (2/2) >>>
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.