تخطَّ إلى المحتوى
arabic nlp

التعرف الآلي على اللهجات (Dialect ASR)

التعرف الآلي على اللهجات هو تعرف آلي على الكلام مُدرَّب ومُقيَّم تحديداً على لهجات عربية منطوقة إقليمية، كالمصرية أو الخليجية، لا على الفصحى فقط.

تُقاس معايير ASR القياسية للعربية عادة بالفصحى — السجل الرسمي المكتوب والإذاعي الذي يُدرَّس في المدارس — لأن معظم بيانات التدريب المُفرَّغة متوفرة بها. لكن لا أحد تقريباً يتحدث الفصحى في مكالمة هاتفية مع عيادة أو مطعم أو بنك؛ الناس يتحدثون لهجتهم المحلية، وتختلف اللهجات عن الفصحى وعن بعضها في المفردات والقواعد والنطق بقدر يقارب الفرق بين البرتغالية والإسبانية تقريباً. يسد التعرف الآلي على اللهجات هذه الفجوة عبر تدريب النموذج، والأهم اختباره، مقابل تسجيلات حقيقية للهجة مصرية أو سعودية أو إماراتية أو خليجية أخرى.

الاختبار العملي لأي مزوّد يدّعي "دعم اللغة العربية" هو أن تطلب معدل خطأ الكلمات على لهجتك تحديداً وظروف المكالمة الفعلية (صوت هاتفي، ضوضاء خلفية)، لا على معيار فصحى نظيف. الوكيل الصوتي الذي يحقق نتيجة جيدة على صوت أخبار فصيحة قد لا يفهم متصلاً من القاهرة يطلب إعادة جدولة موعد، لأن الكلمات اليومية والتبديل اللغوي مع الإنجليزية واللكنات الإقليمية لم تكن أبداً ضمن مجموعة تقييمه. لهذا يُعد تقييم اللهجات قبل الإطلاق خطوة معيارية عند نشر وكلاء صوت عربية بمصداقية في مصر والخليج.

تواصل عبر واتساب