دمج التعلم العميق وذكاء السرب للتعرف على الكلام: مراجعة
الصفحة 1-9
نور يوسف، علا عبدالمجيد
المستخلص ملخص
مع التركيز على التعلم العميق وتقنيات التحسين المستوحاة من علم الأحياء، تُقدم هذه الورقة البحثية نظرة عامة شاملة على التطورات الحالية في أنظمة كشف الصوت والانفعالات. الشبكات المتكررة المتقدمة مثل GRU وSVNN، وأطر عمل التشفير وفك التشفير القائمة على الانتباه، وبنى CNN-LSTM الهجينة، ليست سوى أمثلة قليلة من النماذج التي تمت دراستها في الأوراق البحثية. ولزيادة المتانة، تُستخدم طرق استخراج الميزات مثل MFCC وPLPC وLPCC وبنوك مرشحات log Mel بشكل متكرر، بالتزامن مع تقنيات تعزيز البيانات، بما في ذلك اضطراب السرعة، وحقن الضوضاء، وتحويل درجة الصوت. ولتحسين اختيار الميزات وأداء المصنف، تُستخدم عدد من طرق التحسين، بما في ذلك تحسين سرب الجسيمات (PSO)، وتحسين سرب القطط (CSO)، وتحسين سرب الديدان المتوهجة (GSO)، والتقنيات الهجينة المبتكرة مثل MUPW وGREO. تُظهر الأعمال المدروسة دقةً فائقةً في مجموعة متنوعة من المهام، مثل أنظمة التعرف متعددة الوسائط (السمعية والبصرية)، والتعرف على اللهجات العربية، وتصنيف الكلام العاطفي. ووفقًا للنتائج التجريبية، هناك تحسينات كبيرة في الأداء مقارنةً بالنماذج القياسية؛ ففي بعض الأنظمة، يمكن أن تصل معدلات الدقة إلى 99.76%. تُسلّط هذه الورقة الضوء على الفعالية المتزايدة لدمج التعلم العميق مع التحسين الذكي، كما تُقدّم توصياتٍ للتطورات المستقبلية، بما في ذلك البنى القائمة على المحولات، والتكيف الآني، وزيادة البيانات الخاصة بالمجال.
التطورات في النماذج عالية الأداء لمعالجة اللغة الطبيعية: مراجعة
الصفحة 11-17
محمد اسلام، طاهر محمود
المستخلص
التعلم الذاتي للتعرف على الكلام: مراجعة شاملة
الصفحة 19-22
ابراهيم ال زين العابدين، فاتن ثائر
المستخلص ظهر التعلم الذاتي (SSL) كنهج ثوري في مجال التعرف على الكلام، حيث يمكّن النماذج من الاستفادة من كميات هائلة من البيانات غير الموسومة ويقلل الاعتماد على مجموعات البيانات المعلّمة. تستعرض هذه الورقة البحثية منهجيات التعلم الذاتي الرئيسية مثل التعلم التبايني، والتنبؤ المقنع، وتقنيات التجميع، والنهج القائمة على المعلومات المتبادلة، وتقيم فعاليتها في مهام التعرف على الكلام. يبرز التعلم التبايني، المتمثل في أطر عمل مثل SimCLR وMoCo، في تعزيز متانة الميزات من خلال زيادة البيانات والعينات السلبية. بينما يتفوق التنبؤ المقنع، كما في نموذج Wav2Vec 2.0، في تعلم العلاقات السياقية من خلال إعادة بناء المقاطع الصوتية المقنعة. تحسّن طرق التجميع التعميم من خلال تجميع الميزات الصوتية المتشابهة، في حين تعمل تقنيات المعلومات المتبادلة على تحسين جودة التمثيل. على الرغم من هذه المزايا، تواجه منهجيات التعلم الذاتي تحديات مثل تعقيد التنفيذ، واعتمادها على جودة البيانات، والاحتياجات الحسابية العالية. تشمل اتجاهات البحث المستقبلية تطوير نماذج هجينة تجمع بين التعلم الذاتي والتعلم الخاضع للإشراف، ودمج الوسائط المتعددة، وتطبيقات في اللغات قليلة الموارد والأنظمة في الوقت الفعلي. من خلال معالجة هذه التحديات، يعد التعلم الذاتي بتطوير تقنيات التعرف على الكلام، مقدماً حلولاً قابلة للتطوير وفعالة لتطبيقات متنوعة في العالم الحقيقي.
الاتجاهات والتحديات والاتجاهات المستقبلية لإنترنت الأشياء الذكي والتعلم العميق: مراجعة
الصفحة 23-29
عمر هادي
المستخلص
مراجعة شاملة للتعرف على العواطف في الصوت: التقدمات، التحديات، والاتجاهات المستقبلية
الصفحة 31-36
لبنى الكحلة، ماهر خلف، اسماء موفق
المستخلص
