مقایسه پردازندههای گرافیکی GPU NVIDIA Tesla/Quadro با NVIDIA GeForce 2/2
در اینجا به ادامه مقایسه پردازندههای گرافیکی (GPU) NVIDIA Tesla/Quadro با NVIDIA GeForce میپردازیم. در بخش دوم مشخصاتی از قبیل مقایسه PCIe و NvLink، پشتیبانی از نرم افزارهای کربردی، سیستم عاملها، چرخه عمر محصول، کارایی توان مصرف، موتورهای DMA و سایر مشخصات در نظر گرفته شده است.
PCI-E در برابر NVLink: بازدهی اتصال GPU به کامپیوتر و GPU به GPU
یکی از گلوگاههای بالقوه در مورد کارایی GPU انتظار برای انتقال اطلاعات به GPU است.، خصوصا زمانی که چندین پردازنده گرافیکی به طور موازی با یکدیگر کار میکنند. انتقال سریع دادهها به طور مستقیم، باعث عملکرد سریعتر برنامه میشود. GPUهای GeForce از طریق PCI-Express متصل میشوند که دارای حداکثر توان خروجی تئوری 16 گیگابایت بر ثانیه است. پردازندههای NVIDIA Tesla / Quadro با استفاده از NVLink قادر به اتصال بسیار سریعتر هستند. اتصال NVLink در سری “پاسکال” به هر یک از پردازندههای گرافیکی اجازه میدهد تا با سرعت 80 گیگابایت بر ثانیه (160 گیگابایت بر ثانیه در حالت دو طرفه) ارتباط برقرار کنند. اتصال NVLink 2.0 در سری “Volta” اجازه میدهد تا هر GPU با نرخ 150 گیگابایت بر ثانیه (300 گیگابایت بر ثانیه در حالت دوطرفه) ارتباط برقرار کند. اتصال NVLink بین GPUها و همچنین بین CPUها و GPUها در پلتفورم OpenPOWER پشتیبانی میشود. تنها GPUهای Tesla و Quadro از NVLink پشتیبانی میکنند.
پشتیبانی نرمافزارهای کاربردی
در حالی که برخی از برنامههای نرمافزاری قادر به استفاده از توان پردازشی GPUهایی هستند که از CUDA پشتیبانی می کنند، برخی دیگر برای سری حرفهای GPU طراحی و بهینه شدهاند. بیشتر نرمافزارهای حرفهای فقط رسما از GPUهای NVIDIA Tesla و Quadro پشتیبانی میکنند. استفاده از GeForce در این نرمافزارها ممکن است امکان پذیر باشد، اما توسط تولیدکننده نرمافزاری پشتیبانی نخواهد شد. در برخی موارد، اصلا نرمافزار روی کارتهای گرافیک GeForce اجرا نمیشود.
پشتیبانی سیستمعامل
اگر چه درایورهای GPUهای NVIDIA متنوع هستند، اما درایورهای GeForce برای سیستمعاملهای ویندوز سرور وجود ندارد. پردازندههای گرافیکی GeForce تنها در ویندوز 7، ویندوز 8 و ویندوز 10 پشتیبانی می شوند. گروههایی که از ویندوز سرور استفاده میکنند، باید محصولات حرفهای تسلا و Quadro را انتخاب کنند. درایورهای لینوکس، از تمام پردازندههای گرافیکی NVIDIA پشتیبانی میکنند.
چرخه عمر محصول
با توجه به ماهیت بازار مصرف کنندگان کارت گرافیک، محصولات GeForce یک چرخه عمر نسبتا کوتاه دارند (معمولا حدود یک سال بین اولین تولید محصول و پایان تولید). پروژه هایی که نیاز به طول عمر محصول بیشتری دارند (مانند کسانی که ممکن است نیاز به قطعات جایگزین را تا 3 سال پس از خرید داشته باشند) باید از یک GPU حرفهای استفاده کنند. محصولات Tesla و Quadro دارای چرخه عمر طولانی مدت و پشتیبانی طولانی مدت هستند. علاوه بر این، GPUهای حرفهای در چرخه تولید تحت آزمایش و بررسی کامل قرار میگیرند.
کارایی توان مصرفی
پردازندههای گرافیکی GeForce برای استفاده در بازیهای کامپیوتری طراحی شدهاند و معمولا برای مصرف توان بهینه نشدهاند. در مقابل، GPUهای Tesla برای استفاده در مقیاس بزرگ طراحی شدهاند که در آن بهرهوری از توان مهم است. این باعث میشود که GPUهای Tesla برای کاربردهای بزرگ مناسب باشند. به عنوان مثال، GeForce GTX Titan X برای کاربردهای یادگیری عمیق روی کامپیوترهای دسکتاپ محبوب است. در مورد سرور، پردازنده Tesla P40 دارای عملکرد تطبیقیافته و ظرفیت حافظه دو برابر است. با این حال، هنگامی که آنها را در کنار یکدیگر قرار میدهیم، تسلا انرژی کمتری مصرف میکند و گرمای کمتری تولید میکند.
موتورهای DMA
موتور دسترسی مستقیم به حافظه (DMA) در یک GPU برای انتقال سریع داده بین حافظه سیستم و حافظه گرافیکی استفاده میشود. از آنجا که اینگونه انتقال داده، بخشی از هر برنامه در دنیای واقعی است، عملکرد آن برای کارایی GPU حیاتی است. انتقالهای کند سبب می شود که هستههای پردازنده تا ورود اطلاعات به حافظه گرافیکی بیکار شوند. به همین ترتیب، بازگشت کند نتایج باعث میشود CPU منتظر دریافت داده از پردازنده گرافیکی بماند. محصولات GeForce دارای یک موتور DMA است که می تواند دادهها را در یک جهت در هر زمان انتقال دهد. اگر دادهها به GPU آپلود شوند، هر نتیجهای که توسط GPU محاسبه میشود، تا تکمیل آپلود، نمیتواند به CPU بازگردانده شود. به همین ترتیب، بازگرداندن نتایج به دست آمده از پردازنده گرافیکی به CPU، انتقال هر داده جدیدی را که باید به GPU آپلود شود، را مسدود می کند. البته تنها یک مدل از GeForce، یعنی GeForce GTX Titan X، دارای موتورهای DMA دوگانه است. محصولات Tesla دارای دو موتور DMA برای رفع این گلوگاه هستند. دادهها میتوانند همزمان به GPU وارد شوند و از GPU خارج شوند.
GPU Direct RDMA
فن آوری GPU-Direct NVIDIA اجازه می دهد تا سرعت انتقال داده بین GPUها به طور قابل توجهی بهبود یابد. با استفاده از این تکنولوژی، قابلیتهای مختلف ارائه میگردد که مهمترین آنها قابلیت RDMA است. به طور سنتی، ارسال اطلاعات بین GPUهای یک کلاستر، با بار 3 کپی کردن انجام میشود (یک بار به حافظه سیستم GPU، یک بار به حافظه سیستم CPU و یک بار به حافظه درایور InfiniBand). GPU Direct RDMA کپی به حافظه سیستم را حذف می کند و اجازه میدهد GPU به طور مستقیم از طریق InfiniBand به یک سیستم دیگر داده ارسال کند. در عمل، این موجب کاهش 67 درصدی تاخیر و افزایش 430 درصدی پهنای باند برای پیامهای کوچک MPI شده است. در نسخه 8 کودا، انویدیا GPU Direct RDMA ASYNC را معرفی کرده است که اجازه میدهد پردازنده گرافیکی بدون هیچ گونه تعامل با CPU انتقالات RDMA را انجام دهد. پردازندههای GeForce از GPU-Direct RDMA پشتیبانی نمیکنند. هرچند فراخوانهای MPI هنوز هم با موفقیت انجام می شوند، اما انتقال داده از طریق مسیرهای استاندارد کپی حافظه انجام میشود. تنها شکلی از GPU-Direct که روی کارتهای GeForce پشتیبانی می شود، GPU Direct P2P است. این اجازه انتقال سریع در یک کامپیوتر واحد را میدهد، اما برای برنامههایی که به صورت توزیع شده روی سرورهای متعدد اجرا می شود، هیچ کمکی نمیکند. GPUهای Tesla به طور کامل از GPU Direct RDMA و سایر قابلیتهای دیگر GPU Direct پشتیبانی می کنند. آنها هدف اصلی این قابلیت ها هستند و بنابراین بیشترین آزمایش و استفاده در این زمینه را دارند.
Hyper-Q
Hyper-Q Proxy برای MPI وCUDA اجازه می دهد که چندین نخ پردازشی یا چند پردازنده روی یک GPU واحد کار کنند. این ویژگی برای برنامههای موازی نوشته شده با MPI کارایی دارد، زیرا این کدها برای استفاده از هستههای پردازنده طراحی شدهاند. فراهم آوردن امکان پذیرش کار از هر یک از پروسههای MPI در حال اجرا بر روی یک سیستم می تواند به افزایش قابل توجه عملکرد GPU منجر شود. همچنین میتواند فرایند افزودن استفاده از توان پردازشی GPU به یک برنامه موجود را تسهیل نماید. با این حال، تنها شکل Hyper-Q که در GPUهای GeForce پشتیبانی میشود، Hyper-Q برای CUDA Streams است. این ویژگی اجازه میدهد تا GeForce محاسبات موازی را از هستههای CPU دریافت و اجرا کند، اما برنامههای در حال اجرا روی چند کامپیوتر، قادر به استفاده از یک GPU نخواهند بود.
نظارت و مدیریت تواناییهای GPU
بسیاری از پارامترهای نظارتی و قابلیتهای مدیریت GPU (که هنگام استفاده از چندین سیستم GPU حیاتی هستند) تنها در پردازندههای Tesla حرفهای پشتیبانی میشوند. ویژگیهای نظارتی که در GPUهای GeForce پشتیبانی نمیشوند عبارتند از:
- NVML / nvidia-smi برای نظارت و مدیریت وضعیت و قابلیتهای هر GPU. این ویژگی امکان اتصال GPU به تعدادی از برنامههای کاربردی و ابزارهای نظارتی مانند Ganglia، Perl و Python را فراهم میآورد.
- OOB (نظارت سختافزاری از طریق IPMI) اجازه میدهد تا سیستم بر سلامت GPU نظارت کند، سرعت فن را برای خنکسازی مناسب دستگاه تنظیم کند و در صورت مشاهده مشکل پیغام هشدار ارسال نماید.
- InfoROM (دادههای دائمی برای پیکربندی و حالت) دادههای تکمیلی برای هر GPU ارائه میدهد.
- ابزار NVHealthmon برای مدیران کلاستر یک ابزار آماده برای نظارت بر وضعیت GPU فراهم میکند.
- TCC اجازه می دهد که GPU ها تنها برای حالت نمایش یا تنها برای حالت پردازش تنظیم شوند.
- ECC (تشخیص و اصلاح خطای حافظه)
ابزارهای مدیریت کلاستر از قابلیتهای ارائه شده توسط NVIDIA NVML بهره میبرند. تقریبا 60 درصد از این قابلیتها در GeForce وجود ندارد. جدول زیر مقایسهای دقیقتر از ویژگیهای NVML پشتیبانی شده در GPUهای Tesla و GeForce ارائه میدهد:
Feature | Tesla | Geforce |
---|---|---|
Product Name | yes | yes |
Show GPU Count | yes | yes |
PCI-Express Generation (e.g., 2.0 vs 3.0) | yes | – |
PCI-Express Link Width (e.g., x4, x8, x16) | yes | – |
Current Fan Speed | yes | yes |
Current Temperature | yes | yes* |
Current Performance State | yes | – |
Clock Throttle Status | yes | – |
Current GPU Usage (percentage) | yes | – |
Current Memory Usage (percentage) | yes | yes |
GPU Boost Capability | yes | yes^ |
ECC Error Detection/Correction Support | yes | – |
List Retired Pages | yes | – |
Current Power Draw | yes | – |
Set Power Draw Limit | yes | – |
Current GPU Clock Speed | yes | – |
Current Memory Clock Speed | yes | – |
Show Available Clock Speeds | yes | – |
Show Available Memory Speeds | yes | – |
Set GPU Boost Speed (core clock and memory clock) | yes | – |
Show Current Compute Processes | yes | – |
Card Serial Number | yes | – |
InfoROM image and objects | yes | – |
Accounting Capability (resource usage per process) | yes | – |
PCI-Express IDs | yes | yes |
NVIDIA Driver Version | yes | yes |
NVIDIA VBIOS Version | yes | yes |
GPU Boost
تمام محصولات NVIDIA GPU از GPU Boost پشتیبانی میکنند، اما پیادهسازی آنها بسته به سناریوی مورد استفاده، متفاوت است. کارتهای GeForce برای استفاده در دسکتاپ و بازی ساخته شدهاند. GPU های Tesla برای استفاده در بار کاری بالا و طولانی مدت طراحی شدهاند که در آن پایداری و قابلیت اطمینان از اهمیت بالایی برخوردار است. با توجه به این ویژگیها، GPU Boost در Tesla متفاوت از GeForce عمل میکند.
GPU Boost روی GeForce چگونه عمل میکند؟
در مورد Geforce، کارت گرافیک به طور خودکار سرعت ساعت و ولتاژ را بر اساس دمای GPU تعیین میکند. دما به عنوان متغیر مستقل مناسب است زیرا تولید گرما باعث افزایش سرعت فن می شود. برای بازیهای با گرافیک پایین و یا برای استفاده عمومی از کامپیوتر، کاربر میتواند از تجربه یک سیستم بی سر و صدا لذت ببرد. با این حال GPU Boost در هنگام بازی کردن که نیاز به پردازش گرافیکی بالا دارد، به طور خودکار سرعت ساعت و ولتاژ را افزایش میدهد ( که منجر به تولید سروصدای بیشتری میگردد).
GPU Boost روی Tesla چگونه عمل میکند؟
سطح GPU Boost در تسلا میتواند توسط مدیر سیستم یا کاربر مشخص شود. سرعت ساعت به یک فرکانس خاص تنظیم میشود. به جای اینکه سرعت ساعت را در سطوح مختلف شناور باشد، سرعت دلخواه مورد نظر به صورت ایستا تنظیم میشود مگر اینکه به آستانه مصرف توان (TDP) رسیده باشد. این یک نکته مهم است زیرا پردازندههای کمکی در یک محیط HPC اغلب نیاز به همگام سازی با یکدیگر دارند. تعیین سطح GPU Boost در تسلا به مدیران سیستم اجازه میدهد تا سرعت بهینه را تعیین کنند و ان را برای همه GPUها به طور یکسان تنظیم کنند.
برای برنامههایی که به کارایی بالا نیاز دارند، جدیدترین پردازندههای Tesla امکان Auto Boost را در گروههای Boost همگام در نظر گرفته شده است. با فعال شدن Auto Boost، هر گروه از GPUها سرعت ساعت را افزایش میدهد. اعضای هر گروه ساعتها را با یکدیگر همگام سازی می کنند تا عملکرد مناسب در گروه را تضمین کنند.
برای تحیه سرور ایستاده جی چی یو و برای تحیه سرور با پردازنده گرافیکی از محصولات سورین می توانید استفاده کنید. همچنین می توانید به کلاستر جی پی یو با پردازنده گرافیکی انویدیا دسترسی پیدا کنید.
دیدگاه خود را ثبت کنید
تمایل دارید در گفتگوها شرکت کنید؟در گفتگو ها شرکت کنید.