هذا الموضوع يحتوي على 14 رد و 4 مشاركون وتمّ تحديثه آخر مرة بواسطة AboAlabbas قبل 4 سنوات، 6 شهور.
- موضوع
-
السلام عليكم ورحمة الله وبركاته،،
ووردبريس 3.7 قدمت ميزة جديدة و هي ترتيب نتائج البحث عبر الأفضلية، في خوارزمية البحث الجديدة للووردبريس، تقوم بحذف كلمات تسمى “الكلمات المستبعدة” لكي يتم تحسين طريقة البحث في قاعدة البيانات.
ما هي الكلمات المستبعدة؟
الكلمات المستبعدة (stop-words) هي الكلمات التي تستبعد قبل المعالجة اللغوية الآلية للبيانات (نصوص). وهي الكلمات التي تتكرر في النصوص مثل (في، من، إلى،…) ويستحسن تجاهلها وعدم فهرستها من أجل تحسين البحث. ويرجع الفضل لهانس بيتر لوهن (من الرواد في استرجاع المعلومات) في استعمال هذا المصطلح والمفهوم في التطوير
إقتباس من مشروع “الكلمات العربية المستبعدة“.
ما المطلوب؟
حسب البحث الذي قمت حول أي مشاريع سابقة لتجميعات “الكلمات المستبعدة العربية”، بعض القوائم تتعدى 1000 كلمة! نحن نحتاج إلى ما يقارب 100 كلمة كحد اقصى في الترجمة الأساسية للووردبريس.طبعاً المسألة ليست مجرد “ترجمة” فهذا الموضوع شديد الحساسية، وممكن يؤثر على كثير من المواقع إن تم إختيار الكلمات بشكل عشوائي، لذا قمت بمراسة بعض المختصين في مجال “اللغات الطبيعية” و مازلت أنتظر الرد.
إلى ذلك الحين، هذا الموضوع مفتوح لأي إقتراح بهذا الخصوص..
يجب تسجيل الدخول للرد على هذا الموضوع.