رسالة ماجستير في كلية العلوم تناقش مولد تعليق الصور باستخدام نماذج التعلم العميق
ناقش قسم الحاسبات في كلية العلوم بجامعة ديالى رسالة الماجستير الموسومة بـ (مولد تعليق الصور باستخدام نماذج التعلم العميق) للطالب ياسر حميد زيدان في قاعة المناقشات في قسم الفيزياء.
هدفت الدراسة الى إنتاج تعليقات توضيحية عالية الجودة عن الصور التي تحتوي معلومات دقيقة ومفيدة عن جميع العناصر والكائنات المرئية الموجودة في الصورة، ويتم استخدام كل من رؤية الكمبيوتر ومعالجة اللغة الطبيعية في هذه المهمة الصعبة المتمثلة في تسمية الصور.
تناولت الدراسة اقتراح نظامين
النظام الأول يستخدم EfficientNet-B7 الذي تم تدريبه مسبقًا ، والثاني يستخدم Inception V3 مُدرَّبًا مسبقًا أيضا، باعتبارهم وحدة تشفير (Encoder) لإستخراج الميزات ، ويستخدم النظامان LSTM مع آلية الانتباه Attention Mechanism كوحدة فك ترميز Decoder لإنشاء تسميات توضيحية كلمة بكلمة مع التركيز على الأجزاء الأكثر صلة بالصورة.
واظهرت نتائج النظام الأول مع EfficientNet-B7 المدربة مسبقًا أفضل وأعلى في جميع المقاييس المستخدمة.