أعلنت ويكيميديا عن إطلاق مشروع جديد يهدف إلى جعل بيانات ويكيبيديا أكثر وصولاً لأنظمة الذكاء الاصطناعي من خلال قاعدة بيانات مبتكرة تعتمد على تقنية البحث الدلالي القائم على المتجهات مما يسهل على نماذج الذكاء الاصطناعي مثل نماذج اللغة الكبيرة LLMs الوصول إلى المعرفة المتاحة في ويكيبيديا والتي تتضمن حوالي 120 مليون مدخل كما أن هذا المشروع، الذي تم تنفيذه بالتعاون مع شركات مثل Jina.AI وDataStax، يوفر بيانات منظمة بعناية لدعم تطوير أنظمة الذكاء الاصطناعي مع التركيز على توفير معلومات دقيقة وموثوقة للمطورين الذين يسعون إلى تحسين نماذجهم بناءً على المعرفة الموثوقة المتاحة على المنصة.
ويكيميديا تطلق قاعدة بيانات جديدة لتعزيز الوصول إلى معارف ويكيبيديا
أعلنت ويكيميديا عن إطلاق قاعدة بيانات مبتكرة تهدف إلى تسهيل الوصول إلى معارف ويكيبيديا من قبل نماذج الذكاء الاصطناعي، المشروع المعروف باسم "مشروع تضمين ويكيدا" يعتمد على تقنية البحث الدلالي القائم على المتجهات، وهي تقنية تتيح للأجهزة فهم معاني الكلمات والعلاقات بينها، يتم تطبيق هذه التقنية على البيانات الموجودة في ويكيبيديا ومنصاتها الشقيقة، والتي تحتوي على حوالي 120 مليون مدخل، هذا التطور يعد خطوة مهمة نحو تحسين إمكانية استخدام المعلومات المتاحة في ويكيبيديا بشكل أكثر فعالية.
دعم جديد للذكاء الاصطناعي مع بروتوكول MCP
بالتزامن مع إطلاق قاعدة البيانات، تم تقديم دعم جديد لبروتوكول "نموذج السياق" MCP، وهو معيار يساعد أنظمة الذكاء الاصطناعي على التواصل مع مصادر البيانات، هذا المشروع يسهل الوصول إلى البيانات من خلال استفسارات اللغة الطبيعية من نماذج اللغة الكبيرة LLMs، تم تنفيذ هذا المشروع بالتعاون بين فرع ويكيميديا في ألمانيا وشركة Jina.AI المتخصصة في البحث العصبي، بالإضافة إلى شركة DataStax، التي تدرب البيانات في الوقت الفعلي تحت ملكية شركة آي بي إم.
تحسينات جديدة في نظام البحث
لطالما قدم ويكيدا بيانات قابلة للقراءة الآلية، ولكن الأدوات السابقة كانت تقتصر على البحث بالكلمات الرئيسية واستعلامات SPARQL، أما النظام الجديد فيعمل بشكل أفضل مع أنظمة التوليد المعزز بالاسترجاع RAG، مما يتيح لنماذج الذكاء الاصطناعي سحب معلومات خارجية، هذا يوفر للمطورين الفرصة لتأسيس نماذجهم على المعرفة التي تم التحقق منها من قبل محرري ويكيبيديا، البيانات منظمة لتوفير السياق الدلالي، فعلى سبيل المثال، عند استعلام قاعدة البيانات عن كلمة "عالم"، ستظهر قوائم لعلماء بارزين وصور معتمدة من ويكيميديا، هذا المشروع يأتي في وقت يتسابق فيه مطورو الذكاء الاصطناعي للحصول على مصادر بيانات عالية الجودة لتعزيز نماذجهم بشكل فعال.
التعليقات