RAG-Kawn يحوّل سياساتك وتعاميمك ومحاضرك وأرشيفك وإجراءاتك العربية إلى طبقة معرفة حية: تُجيب بدقة، تستشهد بالمصدر، تتعلّم من التحديثات، وتعمل داخل حدودك الأمنية.
معظم أنظمة RAG تستدعي. RAG-Kawn يتذكّر، يربط، ويفسّر.
ما سياسة استرجاع المبالغ في العقود الحكومية؟
وفقًا للمادة (12) من سياسة المشتريات، يحق طلب الاسترجاع خلال 30 يومًا من تاريخ التسليم، شريطة توثيق المخالفة عبر النظام[1]، مع موافقة الجهة المختصة[2].
الدليل، لا الحماس
RAG-Kawn يعالج هذا كلّه بمبدأ واحد: سياق أقل، معرفة أفضل.
لماذا الآن؟
السؤال لم يعد «هل نستخدم AI؟» بل أصبح: كيف نجعله موثوقًا، عربيًا، قابلًا للتدقيق، ومجديًا ماليًا؟ في أغلب المشاريع، العائق ليس النموذج — بل طبقة المعرفة التي تغذّيه.
الـ LLM الكبير يستطيع الكلام. لكن المؤسسة تحتاج نظامًا يستطيع المعرفة.
مسح McKinsey: تبنٍّ مقابل أثر
Source S9 — McKinsey State of AI
المشكلة
العربية ليست «لغة واجهة». هي سياق، صرف، لهجات، أنظمة، أسماء جهات، صيغ رسمية، واختصارات داخلية. معظم الأنظمة بُنيت إنجليزية-أولًا ثم أُضيفت العربية كطبقة ترجمة.
السؤال العربي يُحوّل إلى تمثيل ناقص، فتظهر مستندات قريبة لفظيًا لكنها بعيدة مؤسسيًا.
«قرار»، «تعميم»، «لائحة»، «إجراء»، «اختصاص»، «محضر» ليست كلمات عادية داخل الجهات — لها أثر تشغيلي وقانوني.
بدل بناء طبقة معرفة منظمة، تُرسَل كميات أكبر من النص إلى نموذج أكبر: تكلفة أعلى، زمن أطول، ومخاطر أكبر.
من أين أتت الإجابة؟ هل المصدر حديث؟ هل تتعارض السياسة القديمة مع الجديدة؟ هل تم تجاهل استثناء مهم؟
RAG-Kawn لا يعامل العربية كترجمة. يعاملها كبيئة معرفة أصلية.
الفكرة الجوهرية
طريقة RAG التقليدية تبحث في المستندات عند كل سؤال. مدرسة LLM Wiki على طريقة كارباتي تضيف طبقة أذكى: معرفة منظمة تتراكم مع الوقت.
يقرأ الأرشيف من الصفر — في كل مرة.
كل مصدر جديد لا يُخزَّن فقط — بل يُفهم، يُصنَّف، يُربَط، ويُحوَّل إلى معرفة قابلة للاستدعاء.
المعرفة في RAG-Kawn لا تُبحَث فقط. المعرفة تُدار.
لماذا RAG-Kawn مختلف؟
| البُعد | RAG تقليدي | Chatbot طويل السياق | RAG-Kawn |
|---|---|---|---|
| طريقة المعرفة | تقسيم لـ chunks | حشو نصوص بالسياق | Wiki متراكم + RAG |
| اللغة العربية | دعم عام | يعتمد على النموذج | Arabic-first: صرف، صيغ، مصطلحات |
| التكلفة | ترتفع مع الاستعلامات | عالية مع السياق الطويل | نموذج صغير + استدعاء دقيق |
| الثقة | تعتمد على retrieval | تتدهور مع الازدحام | مصادر، روابط، تتبّع، فحص تعارض |
| الحوكمة | غالبًا لاحقة | ضعيفة | مدمجة في التصميم |
| التحديث | إعادة فهرسة/chunking | إعادة تحميل سياق | ingest → تحديث صفحات وفهارس |
| الملاءمة للمؤسسات | جيدة كبداية | محدودة تشغيليًا | مصممة للإنتاج والتدقيق والامتثال |
العربية أولًا. الإنجليزية ثانيًا. لا العكس.
تحتاج نظامًا يفهمها كما تُستخدم داخل العمل. RAG-Kawn يتعامل مع العربية باعتبارها لغة تشغيل، لا لغة ترجمة.
العربية ليست واجهة مستخدم. العربية هي بنية المعنى.
مبني على Tiny LLM
معظم أسئلة المؤسسة ليست «إبداعًا مفتوحًا»، بل مهام متكررة، محكومة، قابلة للتحقق. النموذج الصغير مفتوح الوزن يصبح قويًا حين تحيطه بطبقة معرفة منظمة.
ما السياسة المعتمدة؟ ما آخر إجراء؟ ما الفرق بين التعميم القديم والجديد؟ هل هذه الحالة مستثناة؟
النموذج الصغير لا يخمّن. يقرأ السياق المختار، يلتزم بمصادره، ويرفض الإجابة عند غياب الدليل.
النماذج مفتوحة الوزن يمكن تشغيلها داخل بيئتك تحت تراخيصك وقيودك الأمنية — قابلة للقياس وسيادية.
لا نكبّر النموذج لتعويض فوضى المعرفة. ننظّم المعرفة، فيصغر النموذج وتكبر الدقة.
المعمارية
RAG-Kawn لا يضع Vector DB في المنتصف ثم يسميها معرفة. هو يبني دورة حياة كاملة للمعرفة. اضغط أي طبقة لعرض تفاصيلها.
المصادر الأصلية تبقى كما هي: PDF، Word، HTML، صور، محاضر، تعاميم، لوائح، سياسات، قواعد بيانات، تذاكر دعم، وملاحظات الفرق.
تنظيف وتوحيد العربية قبل الفهرسة: إزالة ضجيج OCR، توحيد الصيغ، معالجة أسماء الجهات، كشف التواريخ، تمييز العناوين، وفهم البنية الرسمية للنص.
تحويل المصادر إلى طبقة Wiki معرفية من صفحات مترابطة.
استدعاء متعدد المسارات لا يعتمد على embedding واحد ولا chunk واحد.
النموذج الصغير لا يخمّن. يقرأ السياق المختار، يلتزم بمصادره، ويرفض الإجابة عند غياب الدليل.
كل إجابة قابلة للفحص: ما المصادر؟ ما المقاطع الداعمة؟ هل الإجابة faithful للمصدر؟ هل السياق كافٍ؟ هل توجد تعارضات؟ هل حُدِّثت السياسة؟ من سأل ومن حصل على ماذا؟
الدليل البحثي
RAG-Kawn لا يُبنى على حماس السوق، بل على ما كشفته الأبحاث فعلًا.
مبني على قدر المسؤولية
في البيئات الحكومية، كل إجابة قد تمسّ خدمة مواطن، قرارًا داخليًا، التزامًا تنظيميًا، أو حقًا ماليًا. الحكومة لا تحتاج إجابة جميلة — تحتاج إجابة مسؤولة.
في الحكومة، الذكاء بلا أثر ليس ذكاءً، إنه مخاطرة.
كل شركة لديها معرفة. القليل فقط يحوّلها إلى أصل تشغيلي. المعرفة التي لا تُستدعى لحظة القرار ليست أصلًا — إنها أرشيف.
المعرفة التي لا يمكن استدعاؤها لحظة القرار ليست أصلًا، إنها أرشيف.
حالات الاستخدام
أسئلة الموظفين عن اللوائح والإجازات والمزايا
تذاكر أقل، إجابات موحّدةمقارنة العقود والسياسات والتعاميم
كشف التعارضات والاستثناءاتإجابات موثّقة من قاعدة معرفة الشركة
تصعيد أقل، دقة أعلىتفسير أدلة الخدمات والإجراءات
جودة أعلى، اجتهاد أقلتلخيص المنافسات والشروط والموردين
قراءة ومراجعة أسرعفحص السياسات مقابل المتطلبات
كشف فجوات الحوكمةبحث ذكي في المحاضر والقرارات
ذاكرة مؤسسية حيةردود عربية موحّدة ومسنودة
زمن تعامل أقلمساعد معرفي للموظفين الجدد وأسئلة على وثائق الاستراتيجية
قرارات أسرع بمصادر أوضحقيمة لكل صاحب قرار
التقنية، المالية، الأمن، القانون، والقيادة. اختر مقعدك حول الطاولة.
RAG-Kawn يحوّل المعرفة من تكلفة خفية إلى أصل قابل للتشغيل. ليس مشروع AI تجريبيًا، بل بنية تحتية للقرار.
// اجعل مؤسستك تجيب من ذاكرتها، لا من التخمين.
بنية modular، قابلة للتشغيل داخل بيئتكم، تعتمد على نماذج صغيرة، استدعاء هجين، وتقييم مستمر.
// تحكم أكبر. تبعية أقل. قابلية قياس أعلى.
RAG-Kawn يحترم مصدر الحقيقة، يفصل بين البيانات الخام وطبقة المعرفة، ويقدم lineage لكل إجابة.
// ليست إجابة فقط. إنها سلسلة معرفة قابلة للتتبع.
النماذج الصغيرة والاستدعاء المركّز يقللان الاعتماد على الاستهلاك المفتوح للتوكنز، ويساعدان في ضبط تكلفة AI.
// ادفع مقابل معرفة قابلة للاستخدام، لا مقابل ضوضاء سياقية.
صلاحيات، عزل، سجلات وصول، مصادر داخلية، وإمكانية تشغيل ضمن بنية العميل.
// AI لا يرى أكثر مما يسمح له نظامك أن يرى.
إجابات موثقة، رفض عند غياب الدليل، كشف تعارضات، وسجل مراجعة.
// كل إجابة يجب أن تعرف طريقها إلى المصدر.
إجابات أسرع، أوضح، وأكثر اتساقًا، بالعربية الطبيعية التي يفهمها المستفيد.
// تجربة رقمية تشبه مؤسستك، لا ترجمة لمنتج أجنبي.
القياس قبل الثقة
قبل أي نشر إنتاجي، يقترح RAG-Kawn اختبارًا واضحًا على بيانات مؤسستك.
| المقياس | ماذا يقيس؟ | لماذا يهم؟ |
|---|---|---|
| Precision@K | هل استدعى المستندات الصحيحة ضمن الأوائل؟ | يقلل الضوضاء |
| Context Recall | هل وجد كل الأدلة المطلوبة؟ | يمنع الإجابات الناقصة |
| Faithfulness | هل الإجابة ملتزمة بالمصدر؟ | يقلل الهلوسة |
| Answer Relevance | هل أجاب على السؤال فعلًا؟ | يحسّن التجربة |
| Citation Accuracy | هل الاستشهاد يقود للمقطع الصحيح؟ | يدعم التدقيق |
| Refusal Accuracy | هل يرفض عند غياب الدليل؟ | يقلل المخاطر |
| Arabic Robustness | هل يفهم الصيغ العربية المتنوعة؟ | جوهر المنتج |
| Latency p95 | زمن الاستجابة لمعظم المستخدمين | مهم للإنتاج |
| Cost / Answer | تكلفة الإجابة الواحدة | مهم للمدير المالي |
| Access Control | هل يحترم الصلاحيات؟ | مهم للأمن |
٥٠٠ إلى ٥٬٠٠٠ وثيقة مختارة · ١٠٠ إلى ٣٠٠ سؤال واقعي من فرقك · مقارنة ضد بحثك الحالي أو RAG موجود. تحصل على تقرير دقة الاستدعاء، تقرير جودة الإجابات، تقرير المخاطر، وتوصية واضحة: Pilot / Production / Not Ready.
ابدأ Benchmark عربي على بياناتكمقارنات صريحة
أداة المحادثة تساعد الموظف. RAG-Kawn يبني ذاكرة المؤسسة.
Vector Search يجد النص. RAG-Kawn يجد المعنى القابل للاستخدام.
ترفع المؤسسة وثائقها أو تربط مستودعاتها.
النظام يقرأ البنية، المصطلحات، التواريخ، الإصدارات، الجداول، والتعارضات.
كل مصدر يتحول إلى صفحات معرفة مترابطة، لا مجرد chunks.
فهرس لفظي، دلالي، مفاهيمي، وصلاحياتي.
يستقبل السؤال، يحدد النية، يستدعي السياق، يجيب، ويستشهد.
كل إجابة يمكن تقييمها وتحسينها، وكل مصدر جديد يحدّث الذاكرة.
الضمانات — ما الذي لا يفعله
أفضل أن يقول النظام «لا أعلم من المصدر» على أن يقول إجابة واثقة بلا دليل.
النشر والأمن
الجهات الحساسة والحكومية
المؤسسات الكبيرة
من لديها أنظمة متفرقة
إدارة واحدة
على مستوى المؤسسة
الأمن بنية، لا إضافة
كل إجابة لها مصدر. كل مصدر له صلاحية. كل استخدام له سجل.
من Pilot إلى Production
فهم الوثائق، المستخدمين، الأسئلة، المخاطر، وأنظمة البيانات.
تقييم جودة المصادر، التكرار، التعارضات، الفجوات، واللغة.
اختبار مبدئي على أسئلة حقيقية ومصادر حقيقية.
إطلاق محدود لإدارة أو فريق مع قياس يومي.
مراجعة الأمن، الخصوصية، الدقة، الصلاحيات، وسجلات التدقيق.
توسيع الاستخدام، ربط الأنظمة، وتفعيل لوحات المراقبة.
تشغيل دائم: ingest، تحديث، lint، قياس، وتحسين.
سبرنت الجاهزية في 14 يومًا
منطق التسعير
يُقاس بـ: مصادر المعرفة · حجم الوثائق · المستخدمون · حساسية البيانات · نموذج النشر · مستوى الحوكمة · التكاملات · حالات الاستخدام · عمق التقييم.
لكن القيمة تُقاس باختلاف: زمن بحث أقل · تذاكر أقل · أخطاء امتثال أقل · onboarding أسرع · معرفة موحّدة · اعتماد أقل على الأفراد · تكلفة AI أكثر قابلية للتنبؤ.
لا نقيس RAG-Kawn بعدد الأسئلة. نقيسه بعدد القرارات التي أصبحت أسرع وأدق.
الأسئلة الشائعة
ليس بالضرورة. RAG-Kawn طبقة معرفة مؤسسية عربية يمكن أن تعمل وحدها أو تتكامل مع أدوات أخرى. الفرق أنه مبني حول مصادر المؤسسة، الصلاحيات، التوثيق، والتقييم.
لأن معظم أسئلة المؤسسة متخصصة ومتكررة وتحتاج استدعاءً صحيحًا أكثر من حاجتها إلى نموذج ضخم. النموذج الصغير يصبح فعالًا عندما يحصل على سياق دقيق ومنظم.
نعم، لكن فلسفته Arabic-first. الإنجليزية تدعم السياق، خصوصًا في الوثائق التقنية والمعايير، لكنها ليست مركز النظام.
نعم، يمكن تصميمه للتشغيل داخل بيئة العميل أو بيئة خاصة حسب المتطلبات الأمنية والتنظيمية.
نعم، عبر طبقة Wiki وعمليات lint يمكن كشف التعارضات، الإصدارات القديمة، والصفحات التي تحتاج مراجعة.
لا يوجد نظام AI يضمن صفر هلوسة في كل الحالات. لكن RAG-Kawn يقلل المخاطر عبر الاستشهاد، رفض الإجابة عند غياب الدليل، قياس faithfulness، وسجلات التدقيق.
من خلال Benchmark على بياناتكم: أسئلة واقعية، مصادر واقعية، ومقارنة واضحة في الدقة، الاستدعاء، زمن الاستجابة، والتكلفة.
نعم، بشرط تصميم حوكمة مناسبة: صلاحيات، اعتماد بشري، سجلات، رفض آمن، وحدود استخدام واضحة.
المستقبل لن يكون لمن يملك أكبر نموذج
المستقبل لمن يملك أوضح معرفة، لا أكبر نموذج. RAG-Kawn يبني هذا المستقبل للعربية. بهدوء. بدقة.
معظم أنظمة RAG تستدعي. RAG-Kawn يتذكّر، يربط، ويفسّر.
المصطلحات
كل مصطلح يهمك في مكان واحد. ابحث، اضغط، وافهم.
خريطة المصادر
المراجع التي تدعم كل ما ورد في هذه الصفحة.
الفكرة الأساسية: بناء Wiki معرفي دائم ومتراكم بدل استدعاء المستندات الخام كل مرة؛ ثلاث طبقات (مصادر خام غير قابلة للتعديل، طبقة Wiki، وSchema تنظيمي) مع ingest وquery وlint.
قدّمت RAG كنموذج يجمع الذاكرة البارامترية للنموذج مع ذاكرة غير بارامترية خارجية، وأنتجت إجابات أكثر تحديدًا وتنوعًا وواقعية من seq2seq وحده.
وجدت أن أداء النماذج قد يتدهور عندما تكون المعلومة المهمة في منتصف السياق، حتى مع النماذج المصممة للسياقات الطويلة.
وجد أن أداء النماذج يتدهور مع زيادة طول المدخلات، وأن انخفاض التشابه بين السؤال والمعلومة يزيد معدل التدهور.
تلخّص تحديات العربية في التعقيد الصرفي، الإملاء والتشكيل، الغموض، قلة البيانات، وتغطية اللهجات، مع الإشارة إلى أكثر من 400 مليون متحدث.
معيار يضم 40 مهمة و14,575 سؤال اختيار من متعدد، وقيّم 35 نموذجًا؛ ووجد مجالًا كبيرًا للتحسن، إذ حقق أفضل نموذج عربي-المركز 62.3%.
تجادل بأن النماذج الصغيرة مناسبة وأكثر اقتصادية لكثير من المهام المتخصصة والمتكررة داخل الأنظمة الوكيلة.
تشير إلى أن تقييم هذه الأنظمة صعب بسبب طبيعتها الهجينة واعتمادها على مصادر معرفة ديناميكية، وتذكر مقاييس مثل relevance وaccuracy وfaithfulness.
ذكرت أن 78% يقولون إن مؤسساتهم تستخدم AI في وظيفة واحدة على الأقل، وأن 71% تستخدم GenAI بانتظام، بينما أكثر من 80% لا يرون أثرًا ماديًا على EBIT.
تذكر أن تغييرات بسيطة في طريقة إنشاء محتوى قاعدة المعرفة قد يكون لها أثر كبير على نجاح RAG، وأن التقييم المرن مع human in the lead مهم للأسئلة الجديدة.
يعرّف خصائص الذكاء الاصطناعي الجدير بالثقة: الصلاحية والموثوقية، السلامة، الأمن والمرونة، الشفافية والمساءلة، القابلية للتفسير، الخصوصية، والإنصاف.
يحدد متطلبات إنشاء وتشغيل وتحسين نظام إدارة للذكاء الاصطناعي داخل المؤسسات، مع التركيز على إدارة المخاطر والفرص والحوكمة.