جلسه ۱۱: برنامهی Reduction Sum به کمک CUDA، محدودیت منابع و Occupancy با Nsight
467 بار بازدید -
3 سال پیش
-
در این جلسه الگوی عملیات
در این جلسه الگوی عملیات محاسبهی Reduction Sum به کمک Reduction Tree را با استفاده از CUDA به چند روش مختلف پیاده کردیم و هر کدام را از لحاظ مصرف منابع و سرعت اجرا مقایسه کردیم. توضیح دادیم که چگونه با کم کردن Divergence در الگوریتم ابتدایی میتوان کارآیی را افزایش داد.
پس از بررسی Work Efficiency الگوریتم موازی Reduction برای عملیات مختلف (Add, Sum, Mult, Max, Min, ...) برنامههای CUDA به همراه تحلیل Divergenceها و WARPها آمد.
در ادامه برای استفادهی بهینه از منابع محاسباتی در GPU استفاده از برگههای Occupancy Calculator را توصیه کردیم و در انتها ابزار Nsight که شرکت Nvidia برای پروفایلگیری (Profiling CUDA) و دیباگ کردن برنامههای CUDA بر روی کارتهای گرافیکی (GPU) خودش ارائه کرده است را معرفی کردیم.
3 سال پیش
در تاریخ 1400/02/07 منتشر شده
است.
467
بـار بازدید شده