ارائه‌ی دکتر سلیمانی - سوی تعمیم‌پذیری خارج از توزیع

158 بار بازدید - 2 سال پیش - موضوع : سوی تعمیم‌پذیری خارج
موضوع : سوی تعمیم‌پذیری خارج از توزیع سخنران: دکتر مهدیه سلیمانی ۳۰ آذر ۱۴۰۱ چکیده: چکیده: به تازگی مدلهای بنیادین عظیم (مانند GPT3 ، CLIP و DALL-E2) از حجم بالای داده جهت تعمیم در دامنه یادگیری بهره میبرند. با این حال، این مدل‌ها در تعمیم خارج از توزیع، شامل داده‌های مرتبط با آموزش با توزیع متفاوت، از مشکلات زیادی رنج میبرند. در این سخنرانی، به برخی از این نقاط ضعف اشاره میشود و سوگیری‌های قیاسی معرفی میشوند که به نظر میرسد در سطوح بالاتر تعمیم‌پذیری و هوشمندی مفید هستند. به عنوان نمونه، با الهام از سیستم شناختی انسان، معماری‌های تنک‌تر و پیمانه‌ای‌تر اجازه یادگیری دانش و مکانیزم‌های قابل بازاستفاده را میدهند. به علاوه، یادگیری نمایش علی، نیز در یادگیری مدل‌های مقاوم در برابر تغییرات دنیای واقعی در توزیع موثر هستند. این سوگیری‌های قیاسی نه تنها باعث بهبود تعمیم خارج از توزیع میشوند، بلکه مقیاس‌پذیری و تفسیرپذیری مدل‌ها را نیز بهبود میدهند.
2 سال پیش در تاریخ 1401/10/02 منتشر شده است.
158 بـار بازدید شده
... بیشتر