جلسه ۱۱: برنامه‌ی Reduction Sum به کمک CUDA، محدودیت منابع و Occupancy با Nsight

مطلع الانوار
مطلع الانوار
467 بار بازدید - 3 سال پیش - در این جلسه الگوی عملیات
در این جلسه الگوی عملیات محاسبه‌ی Reduction Sum به کمک Reduction Tree را با استفاده از CUDA به چند روش مختلف پیاده کردیم و هر کدام را از لحاظ مصرف منابع و سرعت اجرا مقایسه کردیم. توضیح دادیم که چگونه با کم کردن Divergence در الگوریتم ابتدایی می‌توان کارآیی را افزایش داد. پس از بررسی Work Efficiency الگوریتم موازی Reduction برای عملیات مختلف (Add, Sum, Mult, Max, Min, ...) برنامه‌های CUDA به همراه تحلیل Divergenceها و WARPها آمد. در ادامه برای استفاده‌ی بهینه از منابع محاسباتی در GPU استفاده از برگه‌های Occupancy Calculator را توصیه کردیم و در انتها ابزار Nsight که شرکت Nvidia برای پروفایل‌گیری (Profiling CUDA) و دیباگ کردن برنامه‌های CUDA بر روی کارت‌های گرافیکی (GPU) خودش ارائه کرده است را معرفی کردیم.
3 سال پیش در تاریخ 1400/02/07 منتشر شده است.
467 بـار بازدید شده
... بیشتر