هل إحصائية فشل الـ95% حقيقية، أم مبالغة تسويقية؟

إنها نتيجة حقيقية ومنشورة — استطلعت مبادرة NANDA التابعة لمعهد MIT تجارب الذكاء الاصطناعي التوليدي في الشركات عام 2025 ووجدت أن 95% منها لم تحقق عائداً قابلاً للقياس على الأرباح والخسائر. نستشهد بها تحديداً لأنها مزعجة، لا لأنها مريحة: تنطبق على موردي الذكاء الاصطناعي أيضاً، بمن فيهم من يشبهوننا ظاهرياً. القراءة الصادقة ليست "الذكاء الاصطناعي لا يعمل"، بل "تجارب الذكاء الاصطناعي التي تُدار دون ملكية أو مقاييس أو مراقبة لا تعمل"، وهذه مشكلة هيكلية قابلة للحل وليست سبباً لتجنب الذكاء الاصطناعي كلياً.

أطلقنا تجربتنا بالفعل دون مقياس محدد. هل فات الأوان لإصلاح ذلك؟

لا — لكن عليك أن تتقبل أنك ستقيس من اليوم فصاعداً، لا أن تثبت ما حدث بالفعل. حدّد المقياس والتقط خط أساس جديداً الآن، وشغّل النظام لفترة قياس حقيقية (30 يوماً عادة كافية لرؤية نمط)، وعامل ذلك كبداية فعلية للتجربة بغض النظر عن موعد إطلاق الكود. إنها محادثة أصعب مع أصحاب المصلحة الذين يعتقدون أن المشروع أثبت نفسه بالفعل، لكنها الطريقة الوحيدة لمعرفة ما إذا كنت فعلاً ضمن الـ5% أم افترضت ذلك فقط.

ماذا يتضمن عقد الصيانة التشغيلية فعلياً بعد إطلاق نظام الذكاء الاصطناعي؟

بشكل ملموس: شخص يعيد تشغيل مجموعة التقييم وفق جدول ثابت وكلما تحدّث النموذج الأساسي، وشخص يراجع لوحة المعلومات الحية مقابل المقياس المتفق عليه شهرياً ويرصد أي انحراف قبل أن يفعل ذلك عميل، وشخص يملك مساراً محدداً للتصعيد عندما تنخفض ثقة النظام في فئة من المدخلات لم يرها من قبل — لهجة جديدة، خط منتجات جديد، عبارة تنظيمية جديدة. هذا هو الفارق بين نظام بُني مرة واحدة ونظام يستمر في العمل.

كيف يختلف تقييم جاهزية الذكاء الاصطناعي المجاني عن سؤال نانو مباشرة؟

إنها خطوة أولى ذاتية الخدمة، لا مكالمة مبيعات. تعمل عليها بوقتك الخاص، مقابل تجربتك أو فكرتك أنت، دون أي التزام ودون أن يراقبك أحد. الهدف منها إعطاؤك قراءة صادقة ومنظمة لموقع خطتك حالياً من أسئلة الملكية والمقياس والمراقبة في هذا المقال، قبل أن تتحدث مع أي أحد — نحن أيضاً. إذا كشفت عن ثغرات تريد مساعدة في سدها، فالتحدث مع فريقنا بعدها خطوة طبيعية تالية، لا خطوة إلزامية.

تطبيق الذكاء الاصطناعي

لماذا تفشل 95% من تجارب الذكاء الاصطناعي وما يفعله الـ5%

تقول أبحاث MIT إن 95% من تجارب الذكاء الاصطناعي التجريبية في الشركات لا تحقق عائداً أبداً. رأينا ما يكفي منها يموت في الخليج لنعرف بالضبط العادات الثلاث التي تقتلها — وما يفعله الـ5% الناجون بدلاً من ذلك.

Nano AI Team · تنفيذ الذكاء الاصطناعي · 9 دقائق قراءة · 2 يوليو 2026

الرقم الذي يتمنى كل مورّد ذكاء اصطناعي ألا تكون قد قرأته

في عام 2025، استطلع باحثون من مبادرة NANDA التابعة لمعهد MIT عمليات نشر الذكاء الاصطناعي التوليدي في الشركات عبر مختلف القطاعات، ووجدوا أن 95% منها لا تحقق أي عائد قابل للقياس على الأرباح والخسائر. ليس "أقل من المتوقع". ولا "لا يزال في طور التوسع". بل لا عائد إطلاقاً — التجربة عملت، والعرض التجريبي أبهر لجنة التوجيه، وبعد ستة أشهر لا أحد يستطيع الإشارة إلى رقم تحرك بسببها. الـ5% التي نجحت لم تكن تستخدم نماذج أفضل؛ كان معظمها يعمل على نفس النماذج الأساسية التي يستخدمها الجميع. ما ميّزها كان تنظيمياً بالكامل تقريباً: مالك محدد بالاسم، ومقياس وافق عليه أحدهم قبل بدء البناء، وخطة لما سيحدث بعد يوم الإطلاق.

هذا الأمر أكثر أهمية في الخليج مما توحي به عينة MIT، لا أقل. تتحرك المنطقة بسرعة تفوق تقريباً أي مكان آخر — كل من السعودية والإمارات ملتزمتان علناً بأن تصبحا اقتصادات تُقدّم الذكاء الاصطناعي أولاً، وهذا الضغط ينتقل إلى كل مدير تقنية ومدير عمليات لديه تكليف بأن "يفعل شيئاً بالذكاء الاصطناعي" هذا الربع. السرعة دون انضباط هي بالضبط الحالة التي تصفها دراسة MIT. جلسنا أمام ما يكفي من التجارب الفاشلة في الرياض ودبي والقاهرة لنرى نفس أنماط الفشل الثلاثة تتكرر بانتظام يكاد يكون مملاً — وهي ليست الأنماط التي يتحدث عنها معظم الموردين.

نمط الفشل الأول: لا يوجد مالك محدد بالاسم

اسأل عمن يملك نتيجة التجربة، وستحصل عادة على إجابة باسم قسم، لا شخص: "تقنية المعلومات تديرها"، أو "هذا أمر مشترك بين العمليات والتسويق". الأمر المشترك بلا اسم واحد مرتبط به هو مشروع لا أحد فيه مسؤول عن بقائه حياً بعد أول احتكاك بالواقع. رأينا سلسلة تجزئة خليجية تُشغّل تجربة روبوت محادثة عبر واتساب لأربعة أشهر، حيث امتلك فريق تقنية المعلومات التكامل، وامتلك فريق خدمة العملاء المحتوى، ولم يمتلك أي منهما مسؤولية معرفة ما إذا كانت قد قلّلت فعلاً عدد التذاكر — لأن هذا السؤال كان من نصيب أي شخص لم يكن حاضراً في الاجتماع. وعندما توقفت التجربة بهدوء عن أن تهم أحداً في مراجعته الفصلية، توقف الاهتمام بها، وماتت موتاً بطيئاً يشبه مهمة مجدولة لا يتذكر أحد أنه كتبها.

الحل بسيط لدرجة تكاد تكون مهينة، ونادراً ما يُنفَّذ: اسم شخص واحد يُكتب مقابل النتيجة، خطياً، قبل بناء أي سطر كود أو مسار عمل. ليس راعياً يوافق على الميزانية، بل مالكاً يخسر شيئاً شخصياً إن لم يتحرك الرقم. في مشاريعنا، هذا بند غير قابل للتفاوض في عقد نطاق العمل، لأن التجربة ذات المالك المُشتّت هي تجربة فشلت بالفعل، بهدوء.

نمط الفشل الثاني: لا يوجد مقياس قابل للقياس مُحدَّد مسبقاً

النمط الثاني أكثر دقة لأنه يختبئ خلف لغة تبدو كمقياس لكنها ليست كذلك. "تحسين تجربة العميل". "تحديث العمليات". "استكشاف ما يمكن للذكاء الاصطناعي فعله لنا". لا شيء من هذا يمكن قياسه في اليوم الثلاثين، ما يعني أن لا شيء منه يمكن أن يفشل في اليوم الثلاثين أيضاً — والمقياس الذي لا يمكن أن يفشل هو مقياس لا يمكن أن ينجح. نطرح سؤالاً واحداً على كل عميل محتمل قبل أن نحدد أي نطاق عمل: أي رقم، بالتحديد، يتغير إذا نجح هذا؟ إذا استغرقت الإجابة الصادقة أكثر من جملة واحدة، فالتجربة غير جاهزة للبدء.

المقياس الجيد مُملّ عن قصد: عدد المكالمات الفائتة المستردة أسبوعياً، معدل الغياب عن المواعيد قبل وبعد، ساعات إدخال الفواتير اليدوي التي أُلغيت، زمن الرد على واتساب بالدقائق، عدد الاجتماعات المؤهلة المحجوزة شهرياً. إنه محدد بما يكفي لأن يكون خاطئاً. تحدثنا مع مشغّل خدمات لوجستية في القاهرة كان قد أنفق ثمانية أشهر وميزانية معتبرة على تجربة "تحسين الجدولة بالذكاء الاصطناعي" دون تسجيل خط أساس لزمن الجدولة قبل بدء المشروع — فعندما ادّعى المورّد تحسناً بنسبة 20% في اجتماع المراجعة، لم تكن هناك طريقة للتحقق من ذلك، ولا لمعرفة ما إذا كان صحيحاً. حدّد خط الأساس قبل أن تبني. إذا لم تستطع قياس "قبل"، فلن تستطيع إثبات "بعد"، وتتحول التجربة إلى مسألة رأي بدلاً من مسألة حقيقة.

نمط الفشل الثالث: لا عمليات تشغيل أو مراقبة مرفقة بعد الإطلاق

هذا هو النمط الذي يقتل التجارب التي نجحت فعلاً عند الإطلاق. كل نظام ذكاء اصطناعي هو كيان حي يعمل في بيئة متغيرة: النموذج الأساسي يُحدَّثه مزوده، ومورّد يغيّر قالب فاتورته، ولهجة إقليمية جديدة تظهر في حجم المكالمات، وسياسة واجهة برمجة تطبيقات واتساب للأعمال تتغير. النظام الذي لا يراقبه أحد ينحرف بصمت — تتراجع الدقة بضع نقاط كل شهر، ولا يلاحظ أحد لأن لا أحد ينظر، وبحلول الشهر الرابع يعطي وكيل الذكاء الاصطناعي إجابات خاطئة بهدوء لعملاء حقيقيين بينما لا تزال لوحة المعلومات من أسبوع الإطلاق تعرض الأرقام الأصلية، التي فقدت معناها الآن.

شهدنا هذا يحدث لوكيل صوتي عربي مبني بشكل جيد فعلاً لسلسلة عيادات خليجية — بناه فريق كفؤ، وأُطلق بأرقام جيدة، وتُرك بلا مراقبة لخمسة أشهر حتى دفع تحول لهجي في قاعدة مرضى فرع جديد الانضمام معدل التحويل إلى موظف بشري من 8% إلى أكثر من 40% دون أن يُبلَّغ أحد حتى اشتكى أحد المرضى على وسائل التواصل الاجتماعي. النظام لم يتعطل بسبب هندسة سيئة. تعطل بسبب افتراض أن يوم الإطلاق هو خط النهاية بدلاً من طلقة البداية.

ما يفعله الـ5% الناجون بشكل مختلف

لا شيء من هذا غريب أو معقد. المؤسسات التي تقع ضمن الـ5% في دراسة MIT تشترك في أربع عادات غير برّاقة، تُطبَّق بانتظام بدلاً من أن تُبتكر بذكاء. أولاً، عقد نتائج: تُكتب معايير القبول في نطاق العمل قبل بدء البناء، بنفس لغة المقياس المحدد والمُملّ الموصوفة أعلاه، مع تاريخ حقيقي لقرار المتابعة أو التوقف — لا تاريخاً طموحاً. ثانياً، تقييمات: يُختبر كل نظام ذكاء اصطناعي مقابل مجموعة مُقيَّمة من مدخلات حقيقية، بكل لغة ولهجة سيواجهها فعلاً، قبل إطلاقه ومرة أخرى في كل مرة يتغير فيها النموذج الأساسي. ثالثاً، مراقبة: لوحة معلومات حية، لا عرضاً تقديمياً، تتتبع المقياس المتفق عليه أثناء التشغيل الفعلي، بحيث يكون الانحراف مرئياً في الأسبوع الثالث بدلاً من أن يكتشفه عميل غاضب في الشهر السادس. رابعاً، عقد صيانة مستمر: شخص ما ملتزم تعاقدياً بالاستمرار في المراقبة بعد الإطلاق، لأن "سنتحقق من الأمر" دون عقد خلفها هو بالضبط كيف يحدث النمط الثالث لفرق حسنة النية في كل مرة.

هذا هو الفارق كله، ولهذا بنينا منهجيتنا الخاصة — تقييم، تجربة، إثبات — حول بوابة قياس صارمة مدتها 30 يوماً بدلاً من تعاقد مفتوح النهاية. إنها غير مريحة بالتصميم: التجربة التي لا تحقق معاييرها المكتوبة في اليوم الثلاثين إما أن يستمر إصلاحها دون رسوم إضافية، أو تتوقف، بتكلفة زهيدة، عن قصد، قبل أن تنجرف إلى الشهر السادس كبند غير مملوك وغير مُقاس وغير مُراقب لا يريد أحد أن يكون من يلغيه. هذا الانزعاج هو بالضبط ما يفتقر إليه الـ95%.

من أين تبدأ: اكتشف في أي جانب من الـ95% أنت

قبل أن توافق على تجربة ذكاء اصطناعي أخرى، يستحق الأمر عشر دقائق صادقة للإجابة على الأسئلة التي يطرحها هذا المقال حول خطتك أنت: من يملك هذه النتيجة، بالاسم؟ ما الرقم الواحد الذي يتغير إذا نجحت، وهل لديك خط الأساس اليوم؟ من المسؤول تعاقدياً عن مراقبتها في الشهر الرابع؟ بنينا أداة مجانية لتقييم جاهزية الذكاء الاصطناعي لسد هذه الفجوة بالتحديد — وهي فحص ذاتي منظم يمكنك تشغيله على تجربتك أو فكرة مشروعك الخاصة قبل أن تلتزم بميزانية لها، متاحة الآن في مركز الموارد والأدوات لدينا. لن تكتب نطاق العمل نيابة عنك، لكنها ستخبرك، في الوقت الذي يستغرقه قراءة هذا المقال تقريباً، بأي نمط من أنماط الفشل الثلاثة تتعرض له خطتك حالياً.

الأسئلة الشائعة

اكتشف في أي جانب من الـ95% يقع مشروعك القادم للذكاء الاصطناعي

شغّل فكرة تجربتك عبر أداة تقييم جاهزية الذكاء الاصطناعي المجانية لدينا قبل أن تلتزم بميزانية لها، أو تحدث مع فريقنا في القاهرة حول بنائها بعقد نتائج وتقييمات ومراقبة منذ اليوم الأول.

احجز عرضاً توضيحياً تواصل عبر واتساب