جلسه ۱۹: کرنل هیستوگرام - ۲، تحلیل کارآیی عملگر اتمی، تکنیک Privatization
307 بار بازدید -
3 سال پیش
-
در ادامهی توسعهی کرنل برنامهی
در ادامهی توسعهی کرنل برنامهی هیستوگرام (Histogram) در کودا، سرعت اجرای برنامهی قبل به کمک عملگرهای اتمی بررسی شد و برای افزایش سرعت تکنیک Privatization و در موارد مشخص تکنیک Aggregation معرفی شدند.
تحلیل کارآیی عملگرهای اتمی (Atomic Operator) در CUDA برای یک سازمان حافظهی نمونه انجام شد و نشان دادیم که هنوز میتوان سرعت اجرا را بهبود بخشید. برای نیل به این هدف تکنیک خصوصی سازی (Privatization) را معرفی کردیم و با استفاده از Shared Memory راه بهتری ارائه دادیم.
در ادامه برای موارد خاصی که تراکم دادههای یکسان بالاست، مانند تصاویر آسمان، دریا، شب، و ... راه حل بهینهای به نام Aggregation معرفی کردیم که کارآیی را در موارد اینچنینی بهبود میبخشد.
3 سال پیش
در تاریخ 1400/03/12 منتشر شده
است.
307
بـار بازدید شده