تخطَّ إلى المحتوى
تطبيق الذكاء الاصطناعي

لماذا تفشل 95% من تجارب الذكاء الاصطناعي وما يفعله الـ5%

تقول أبحاث MIT إن 95% من تجارب الذكاء الاصطناعي التجريبية في الشركات لا تحقق عائداً أبداً. رأينا ما يكفي منها يموت في الخليج لنعرف بالضبط العادات الثلاث التي تقتلها — وما يفعله الـ5% الناجون بدلاً من ذلك.

Nano AI Team · تنفيذ الذكاء الاصطناعي · 9 دقائق قراءة · 2 يوليو 2026

الرقم الذي يتمنى كل مورّد ذكاء اصطناعي ألا تكون قد قرأته

في عام 2025، استطلع باحثون من مبادرة NANDA التابعة لمعهد MIT عمليات نشر الذكاء الاصطناعي التوليدي في الشركات عبر مختلف القطاعات، ووجدوا أن 95% منها لا تحقق أي عائد قابل للقياس على الأرباح والخسائر. ليس "أقل من المتوقع". ولا "لا يزال في طور التوسع". بل لا عائد إطلاقاً — التجربة عملت، والعرض التجريبي أبهر لجنة التوجيه، وبعد ستة أشهر لا أحد يستطيع الإشارة إلى رقم تحرك بسببها. الـ5% التي نجحت لم تكن تستخدم نماذج أفضل؛ كان معظمها يعمل على نفس النماذج الأساسية التي يستخدمها الجميع. ما ميّزها كان تنظيمياً بالكامل تقريباً: مالك محدد بالاسم، ومقياس وافق عليه أحدهم قبل بدء البناء، وخطة لما سيحدث بعد يوم الإطلاق.

هذا الأمر أكثر أهمية في الخليج مما توحي به عينة MIT، لا أقل. تتحرك المنطقة بسرعة تفوق تقريباً أي مكان آخر — كل من السعودية والإمارات ملتزمتان علناً بأن تصبحا اقتصادات تُقدّم الذكاء الاصطناعي أولاً، وهذا الضغط ينتقل إلى كل مدير تقنية ومدير عمليات لديه تكليف بأن "يفعل شيئاً بالذكاء الاصطناعي" هذا الربع. السرعة دون انضباط هي بالضبط الحالة التي تصفها دراسة MIT. جلسنا أمام ما يكفي من التجارب الفاشلة في الرياض ودبي والقاهرة لنرى نفس أنماط الفشل الثلاثة تتكرر بانتظام يكاد يكون مملاً — وهي ليست الأنماط التي يتحدث عنها معظم الموردين.

نمط الفشل الأول: لا يوجد مالك محدد بالاسم

اسأل عمن يملك نتيجة التجربة، وستحصل عادة على إجابة باسم قسم، لا شخص: "تقنية المعلومات تديرها"، أو "هذا أمر مشترك بين العمليات والتسويق". الأمر المشترك بلا اسم واحد مرتبط به هو مشروع لا أحد فيه مسؤول عن بقائه حياً بعد أول احتكاك بالواقع. رأينا سلسلة تجزئة خليجية تُشغّل تجربة روبوت محادثة عبر واتساب لأربعة أشهر، حيث امتلك فريق تقنية المعلومات التكامل، وامتلك فريق خدمة العملاء المحتوى، ولم يمتلك أي منهما مسؤولية معرفة ما إذا كانت قد قلّلت فعلاً عدد التذاكر — لأن هذا السؤال كان من نصيب أي شخص لم يكن حاضراً في الاجتماع. وعندما توقفت التجربة بهدوء عن أن تهم أحداً في مراجعته الفصلية، توقف الاهتمام بها، وماتت موتاً بطيئاً يشبه مهمة مجدولة لا يتذكر أحد أنه كتبها.

الحل بسيط لدرجة تكاد تكون مهينة، ونادراً ما يُنفَّذ: اسم شخص واحد يُكتب مقابل النتيجة، خطياً، قبل بناء أي سطر كود أو مسار عمل. ليس راعياً يوافق على الميزانية، بل مالكاً يخسر شيئاً شخصياً إن لم يتحرك الرقم. في مشاريعنا، هذا بند غير قابل للتفاوض في عقد نطاق العمل، لأن التجربة ذات المالك المُشتّت هي تجربة فشلت بالفعل، بهدوء.

نمط الفشل الثاني: لا يوجد مقياس قابل للقياس مُحدَّد مسبقاً

النمط الثاني أكثر دقة لأنه يختبئ خلف لغة تبدو كمقياس لكنها ليست كذلك. "تحسين تجربة العميل". "تحديث العمليات". "استكشاف ما يمكن للذكاء الاصطناعي فعله لنا". لا شيء من هذا يمكن قياسه في اليوم الثلاثين، ما يعني أن لا شيء منه يمكن أن يفشل في اليوم الثلاثين أيضاً — والمقياس الذي لا يمكن أن يفشل هو مقياس لا يمكن أن ينجح. نطرح سؤالاً واحداً على كل عميل محتمل قبل أن نحدد أي نطاق عمل: أي رقم، بالتحديد، يتغير إذا نجح هذا؟ إذا استغرقت الإجابة الصادقة أكثر من جملة واحدة، فالتجربة غير جاهزة للبدء.

المقياس الجيد مُملّ عن قصد: عدد المكالمات الفائتة المستردة أسبوعياً، معدل الغياب عن المواعيد قبل وبعد، ساعات إدخال الفواتير اليدوي التي أُلغيت، زمن الرد على واتساب بالدقائق، عدد الاجتماعات المؤهلة المحجوزة شهرياً. إنه محدد بما يكفي لأن يكون خاطئاً. تحدثنا مع مشغّل خدمات لوجستية في القاهرة كان قد أنفق ثمانية أشهر وميزانية معتبرة على تجربة "تحسين الجدولة بالذكاء الاصطناعي" دون تسجيل خط أساس لزمن الجدولة قبل بدء المشروع — فعندما ادّعى المورّد تحسناً بنسبة 20% في اجتماع المراجعة، لم تكن هناك طريقة للتحقق من ذلك، ولا لمعرفة ما إذا كان صحيحاً. حدّد خط الأساس قبل أن تبني. إذا لم تستطع قياس "قبل"، فلن تستطيع إثبات "بعد"، وتتحول التجربة إلى مسألة رأي بدلاً من مسألة حقيقة.

نمط الفشل الثالث: لا عمليات تشغيل أو مراقبة مرفقة بعد الإطلاق

هذا هو النمط الذي يقتل التجارب التي نجحت فعلاً عند الإطلاق. كل نظام ذكاء اصطناعي هو كيان حي يعمل في بيئة متغيرة: النموذج الأساسي يُحدَّثه مزوده، ومورّد يغيّر قالب فاتورته، ولهجة إقليمية جديدة تظهر في حجم المكالمات، وسياسة واجهة برمجة تطبيقات واتساب للأعمال تتغير. النظام الذي لا يراقبه أحد ينحرف بصمت — تتراجع الدقة بضع نقاط كل شهر، ولا يلاحظ أحد لأن لا أحد ينظر، وبحلول الشهر الرابع يعطي وكيل الذكاء الاصطناعي إجابات خاطئة بهدوء لعملاء حقيقيين بينما لا تزال لوحة المعلومات من أسبوع الإطلاق تعرض الأرقام الأصلية، التي فقدت معناها الآن.

شهدنا هذا يحدث لوكيل صوتي عربي مبني بشكل جيد فعلاً لسلسلة عيادات خليجية — بناه فريق كفؤ، وأُطلق بأرقام جيدة، وتُرك بلا مراقبة لخمسة أشهر حتى دفع تحول لهجي في قاعدة مرضى فرع جديد الانضمام معدل التحويل إلى موظف بشري من 8% إلى أكثر من 40% دون أن يُبلَّغ أحد حتى اشتكى أحد المرضى على وسائل التواصل الاجتماعي. النظام لم يتعطل بسبب هندسة سيئة. تعطل بسبب افتراض أن يوم الإطلاق هو خط النهاية بدلاً من طلقة البداية.

ما يفعله الـ5% الناجون بشكل مختلف

لا شيء من هذا غريب أو معقد. المؤسسات التي تقع ضمن الـ5% في دراسة MIT تشترك في أربع عادات غير برّاقة، تُطبَّق بانتظام بدلاً من أن تُبتكر بذكاء. أولاً، عقد نتائج: تُكتب معايير القبول في نطاق العمل قبل بدء البناء، بنفس لغة المقياس المحدد والمُملّ الموصوفة أعلاه، مع تاريخ حقيقي لقرار المتابعة أو التوقف — لا تاريخاً طموحاً. ثانياً، تقييمات: يُختبر كل نظام ذكاء اصطناعي مقابل مجموعة مُقيَّمة من مدخلات حقيقية، بكل لغة ولهجة سيواجهها فعلاً، قبل إطلاقه ومرة أخرى في كل مرة يتغير فيها النموذج الأساسي. ثالثاً، مراقبة: لوحة معلومات حية، لا عرضاً تقديمياً، تتتبع المقياس المتفق عليه أثناء التشغيل الفعلي، بحيث يكون الانحراف مرئياً في الأسبوع الثالث بدلاً من أن يكتشفه عميل غاضب في الشهر السادس. رابعاً، عقد صيانة مستمر: شخص ما ملتزم تعاقدياً بالاستمرار في المراقبة بعد الإطلاق، لأن "سنتحقق من الأمر" دون عقد خلفها هو بالضبط كيف يحدث النمط الثالث لفرق حسنة النية في كل مرة.

هذا هو الفارق كله، ولهذا بنينا منهجيتنا الخاصة — تقييم، تجربة، إثبات — حول بوابة قياس صارمة مدتها 30 يوماً بدلاً من تعاقد مفتوح النهاية. إنها غير مريحة بالتصميم: التجربة التي لا تحقق معاييرها المكتوبة في اليوم الثلاثين إما أن يستمر إصلاحها دون رسوم إضافية، أو تتوقف، بتكلفة زهيدة، عن قصد، قبل أن تنجرف إلى الشهر السادس كبند غير مملوك وغير مُقاس وغير مُراقب لا يريد أحد أن يكون من يلغيه. هذا الانزعاج هو بالضبط ما يفتقر إليه الـ95%.

من أين تبدأ: اكتشف في أي جانب من الـ95% أنت

قبل أن توافق على تجربة ذكاء اصطناعي أخرى، يستحق الأمر عشر دقائق صادقة للإجابة على الأسئلة التي يطرحها هذا المقال حول خطتك أنت: من يملك هذه النتيجة، بالاسم؟ ما الرقم الواحد الذي يتغير إذا نجحت، وهل لديك خط الأساس اليوم؟ من المسؤول تعاقدياً عن مراقبتها في الشهر الرابع؟ بنينا أداة مجانية لتقييم جاهزية الذكاء الاصطناعي لسد هذه الفجوة بالتحديد — وهي فحص ذاتي منظم يمكنك تشغيله على تجربتك أو فكرة مشروعك الخاصة قبل أن تلتزم بميزانية لها، متاحة الآن في مركز الموارد والأدوات لدينا. لن تكتب نطاق العمل نيابة عنك، لكنها ستخبرك، في الوقت الذي يستغرقه قراءة هذا المقال تقريباً، بأي نمط من أنماط الفشل الثلاثة تتعرض له خطتك حالياً.

الأسئلة الشائعة

اكتشف في أي جانب من الـ95% يقع مشروعك القادم للذكاء الاصطناعي

شغّل فكرة تجربتك عبر أداة تقييم جاهزية الذكاء الاصطناعي المجانية لدينا قبل أن تلتزم بميزانية لها، أو تحدث مع فريقنا في القاهرة حول بنائها بعقد نتائج وتقييمات ومراقبة منذ اليوم الأول.

تواصل عبر واتساب