قاعدة البيانات المتجهية (Vector Database)
قاعدة البيانات المتجهية هي قاعدة بيانات متخصصة تخزن المحتوى على شكل تمثيلات رقمية (embeddings) وتسترجع النتائج بحسب التشابه الدلالي — أي المعنى — بدلاً من مطابقة الكلمات الحرفية.
قواعد البيانات التقليدية تبحث بالمطابقة الحرفية: البحث عن كلمة "مكالمة فائتة" يُرجع فقط الصفوف التي تحتوي على هذه العبارة بالضبط. أما قاعدة البيانات المتجهية فتخزن كل جزء من المحتوى — جملة، أو مقطع من مستند، أو رسالة عميل — كتمثيل رقمي (embedding) يلتقط معناه. وعند وصول استعلام، يُحوَّل إلى نفس نوع التمثيل الرقمي، وتُرجع قاعدة البيانات العناصر المخزنة الأقرب رياضياً له، بغض النظر عن الكلمات المستخدمة بالضبط.
هذا هو الجزء الخاص بالاسترجاع في نظام RAG (التوليد المعزز بالاسترجاع): يخزّن وكيل واتساب الذكي لشركة ما وثائق سياساته وقوائم أسعاره ومحادثاته السابقة المحلولة كمتجهات، بحيث عندما يسأل عميل مصري "هو التوصيل بياخد قد إيه؟"، يسترجع الوكيل مقطع السياسة ذي الصلة حتى لو لم يحتوِ على هذه الكلمات بالضبط، ثم يسلّمه لنموذج اللغة لصياغة إجابة مدعومة بالسياق ومناسبة للهجة. من خيارات قواعد البيانات المتجهية الشائعة: Pinecone وWeaviate وQdrant وPostgres مع إضافة pgvector — والاختيار المناسب لنشر في الخليج غالباً ما يعتمد على متطلبات إقامة البيانات بقدر اعتماده على الأداء.
مصطلحات ذات صلة
تبحث عن استشارة مخصصة؟
دعنا نساعدك في فهم وتطبيق هذه التقنيات بما يتناسب مع متطلبات وأهداف شركتك.
احجز مكالمة تعريفية