نشست چهارم: ترنسفورمرها (Transformers) و مدل‌های زبانی بزرگ (LLMs)

حمیدرضا حسین خانی
حمیدرضا حسین خانی
569 بار بازدید - 2 ماه پیش - در این جلسه با مدل
در این جلسه با مدل ترنسفورمر (Transformer) برای پردازش دنباله‌ها آشنا شده و به معرفی مدل‌های زبانی بزرگ (LLM ها) پرداخته‌ایم. لینک‌های کمکی برای مطالعه‌ی بیش‌تر: https://www.seevid.ir/fa/w/XfpMkf4rD6EthemeRefresh=1 https://lena-voita.github.io/nlp_course/seq2seq_and_attention.html https://sebastianraschka.com/blog/2023/self-attention-from-scratch.html https://ocw.sharif.edu/course/id/524 https://www.seevid.ir/fa/w/zjkBMFhNj_g https://www.seevid.ir/fa/w/kCc8FmEb1nY https://www.youtube.com/playlist?list=PLTBGmWNBqOY4z6PUJ8PZq534CMXIhhjcA
2 ماه پیش در تاریخ 1403/04/23 منتشر شده است.
569 بـار بازدید شده
... بیشتر