جلسه ۱۹: کرنل هیستوگرام - ۲، تحلیل کارآیی عملگر اتمی، تکنیک Privatization

مطلع الانوار
مطلع الانوار
307 بار بازدید - 3 سال پیش - در ادامه‌ی توسعه‌ی کرنل برنامه‌ی
در ادامه‌ی توسعه‌ی کرنل برنامه‌ی هیستوگرام (Histogram) در کودا، سرعت اجرای برنامه‌ی قبل به کمک عملگرهای اتمی بررسی شد و برای افزایش سرعت تکنیک Privatization و در موارد مشخص تکنیک Aggregation معرفی شدند. تحلیل کارآیی عملگرهای اتمی (Atomic Operator) در CUDA برای یک سازمان حافظه‌ی نمونه انجام شد و نشان دادیم که هنوز می‌توان سرعت اجرا را بهبود بخشید. برای نیل به این هدف تکنیک خصوصی سازی (Privatization) را معرفی کردیم و با استفاده از Shared Memory راه بهتری ارائه دادیم. در ادامه برای موارد خاصی که تراکم داده‌های یکسان بالاست، مانند تصاویر آسمان، دریا، شب، و ... راه حل بهینه‌ای به نام Aggregation معرفی کردیم که کارآیی را در موارد اینچنینی بهبود می‌بخشد.
3 سال پیش در تاریخ 1400/03/12 منتشر شده است.
307 بـار بازدید شده
... بیشتر