حوار مسجّل مع الدّكتور مصطفى جرّار حول مشروع الانطولوجيا العربيّة
أجرت الأستاذة الباحثة إيمان صبحي دلّول من الجامعة الإسلاميّة في غزة حواراً مسجّلاً مع مدير معهد ابن سينا لهندسة المعرفة والتقنيات العربية-بيرزيت، الدكتور مصطفى جرّار. وكان نص الحوار كالآتي:
– السّلام عليكم ورحمة الله تعالى وبركاته. الدّكتور مصطفى جرّار أستاذ مشارك في جامعة بيرزيت- فلسطين. ومدير معهد ابن سينا لهندسة المعرفة، والتّقنيّات العربيّة بنفس الجامعة. وهو مدير مشروع أنطولوجيا اللّغة العربيّة، والقائم عليه. مرحبا بك دكتور مصطفى.
– حياكِ الله أستاذة إيمان، تشرفنا بكِ، وبالحديث حول مشروع الأنطولوجيا العربيّة.
– شكرا لك دكتور مصطفى، بداية ما هي أنطولوجيا اللّغة العربيّة؟ ومتى ظهرت فكرتها؟
– أنطولوجيا اللّغة العربيّة هي طريقة جديدة لتعريف المفاهيم، وتعريف معاني الكلمات العربيّة عن طريق تصنيفها، وتشجيرها، بحيث تكون الأنطولوجيا هي عبارة عن شجرة من معاني الكلمات العربيّة، وليست شجرة بكلمات اللّغة العربيّة. وهنا نقصد غالبيّة الكلمات العربيّة وليس جميعها.بدأت الفكرة تطبّق منذ عام 2009/2010م. والفكرة كانت موجودة منذ 2003م، ولكن لم يتاح لنا تطبيقها إلّا عندما عدت إلى جامعة بيرزيت.
– نعم، كيف يمكن بناء أنطولوجيا للّغة العربيّة؟
– ما علاقة أنطولوجيا اللّغة العربيّة بالمعاجم اللّغويّة؟
– أنطولوجيا اللّغة العربيّة هي الجيل الجديد والحديث للمعاجم العربيّة. في الحقيقة المعاجم العربيّة غالبيتها يركّز على تصريف الكلام. فإذا سألنا عن معنى أكل. نقول: أكل يأكل أكلا؛ فهو آكل، وأكل الشّيء أي ابتلعه. ويمكننا أن نستدل على هذه المعاني والمقولات بأبيات من الشّعر، والآيات، والأحاديث، وإلى آخره. فلا تركّز معاجم اللّغة العربيّة على الصّفات الجوهريّة في تعريف معاني الكلمات. وهنا يأتي دور الأنطولوجيا أوّلا؛ لأنّها تصف معاني الكلمات وصفا دقيقا جدا، يركّز كما قلنا على الصّفات الجوهريّة الّتي تميّز المفهوم عن المفاهيم الأخرى. إضافة إلى ذلك فإنّ المعاجم العربيّة أصبح لها أهميّة، والمعاجم بشكل عام أصبح لها أهميّة كبرى في العصر الحديث، تستعمل في تطبيقات عديدة، كتطبيقاتها في محركات البحث.وتطبيقات أخرى يستفيد منها الإنسان، بالإضافة إلى الآلة.وبالتّالي فإنّ الأنطولوجيا تعتبر جيلا جديدا في هندسة المعاجم.
– دكتور مصطفى، وضّح لنا بمثال بسيط، كيفيّة استخدام الأنطولوجيا؟
– للأنطولوجيات اللّغويّة عدّة استخدامات، سأعدّد بعضا منها: مثلا: عند البحث عن بيانات ما، نستخدم محركات البحث. حيث يمكن لمحرّك البحث أن يستعمل الأنطولوجيا داخليّا؛ ليكون أكثر ذكاء. فإذا بحث الإنسان مثلا: عن كلمة (إجازة). سيرجّع محرّك البحث إلى أشياء لها علاقة بكلمة (عطلة) مثلا، ولا أقصد هنافقط المترادفات، ما أقصده هو استخدام شجرة الأنطولوجيا. وبالتّالي يصبح محرّك البحث أكثر ذكاء إذا استعملنا الأنطولوجيا في التّرجمة الآليّة؛ فتصبح المترجمات الآليّة أكثر دقّة لأنّه بإمكاننا ربط الأنطولوجيات اللّغويّة ربطا مفاهيميّا، وليس ترجمة. كما للأنطولوجيّات استخدام آخر فنستخدمها في تطبيقات نسميها ربط وتبادل البيانات، على سبيل المثال: كيف نستعمل الأنطولوجيا في بناء حكومة إلكترونيّة؟، يكون استعمالها في بعض المفاهيم على سبيل المثال كلمة (راتب)، موجودة في أكثر من قاعدة بيانات في الحكومة أو في أكثر من وزارة، وهناك العديد من المصطلحات والمفاهيم الّتي تربط هذه الكلمات في معاني موحّدة في قاموس موحّد. مثلا: كيف يتحدّث اثنين مع بعضهما، ويفهم بعضهما الآخر؟. في ذهن كلّ إنسان قاموس. والنّاس تفهم على بعضهم البعض حيث هناك مفاهيم مشتركة في قاموس أذهانهم. وبالتّالي مثل هذه الفكرة تستعمل عادة في ربط قواعد البيانات نسمّيها(Data integration and interoperability ()قواعد البيانات بنسمّيها perabilityفي ربط قواعد البيانات بنسمّيها ن إنسان لمّن إحنا نتحدّث بيكون في قاموس في ذهنه، والنّاس تفه) بمعنى توافقيّة البيانات، وتستعمل الأنطولوجيا في هذه التّطبيقات كمرجع للمفاهيم. وأذكر استعمال آخر للأنطولوجيا هو الجيل الثّالث للإنترنت، بمعنى قد نستعمل الأنطولوجيا كمعجم جديد من نوع آخر نسمّيه (Conceptual Dictionary). معجم مبني على أساس مفاهيمي ترتبط فيه الكلمات بطريقة مفاهيميّة. كما يمكن استعمال الأنطولوجيا كمرجع للإنسان وليس فقط للآلة.
– ما مدى استفادة انطولوجيا اللّغة العربيّة من انطولوجيا اللّغة الإنجليزيّة (WordNet)؟
– ال(WordNet) أو ما نسميه بشبكة المترادفات الإنجليزيّة كانت في بداية الثّمانينات، أو في آخر الثّمانينات في جامعة برنستون في أمريكا، وطوّرها أناس غير متخصّصين،لا يشتغلون في الأنطولوجيا، ولا في علم المنطق، ولا حتّى في علم ال(IT) (تقنيّة المعلومات). لكنها طوّرت؛ لأغراض أخرى، واشتهرت هذه الأنطولوجيا. ولا تستفيد الأنطولوجيا العربيّة استفادة مباشرة من الأنطولوجيا الإنجليزيّة؛ بل قرّرنا في جامعة بيرزيت أن نتّبع نفس طريقة تمثيل البيانات؛ ليس لأنّ ال(WordNet) هو الأفضل، بل لشهرته؛ فقرّرنا اتّباع نفس منهجيّة تمثيل البيانات؛ لكي يتمّ الرّبط بين الأنطولوجيا العربيّة وال(WordNet)، وهناك تعاون وثيق بين القائمين على مشروع ال(WordNet) في برنستون ومعنا في جامعة بيرزيت؛ وذلك لربط الأنطولوجيا الإنجليزيّة بالأنطولوجيا العربيّة. كما أنّ هناك منهجيّة أخرى لا نسمّيها (Arabic WordNet) ولكن نسمّيها (Arabic Ontology)؛ لأنّن اتّبعنا منهجيّة خاصّة وجديدة، ومتطوّرة أكثر مقارنة بما تمّ في أنطولوجيا اللّغة الإنجليزيّة.
– وما الّذي يميّز أنطولوجيا اللّغة العربيّة عن أنطولوجيا اللّغة الإنجليزيّة؟
– الّذي يميّزها أوّلا: أنّها مؤسّسة، ومؤصّلة فلسفيّا ومنطقيّا، وهذا يعني أنّ ال(WordNet) لم يبنى على أساس علم المنطق. بينما الأنطولوجيا العربيّة مبنيّة على أساس علم المنطق، بالإضافة إلى ذلك هناك تأصيل فلسفي؛ لتصنيف المعاني فكما يعرّف تصنيف المعاني، الكلمات بأنّها قضايا فلسفيّة كبرى. فبالتّالي عند بناء الأنطولوجيا العربيّة يتمّ الرجوع إلى الأدبيّات الفلسفيّة العربيّة القديمة، وكذلك الحديثة، والأجنبيّة، وهذا لم يكن متاحا للفريق الّذي عمل على بناء الأنطولوجيا الإنجليزيّة، وبالتّالي نستطيع القول: بأنّ الأنطولوجيا العربيّة هي أكثر دقّة في تعريفها وتصنيفها للمعنى. فمثلا: عند تعريف الجدول الدّوري، نقول: هل كلّ جدول دوري هو جدول؟، في الأنطولوجيا الإنجليزيّة، يعني يتمّ الحكم على صحّة الادّعاء بأن كلّ جدول دوري هو جدول إذا قبل الناس ذلك، وهذا يعني أنّ اللّغويين هم من يحكمون على صحّة التّصنيف، بينما في الأنطولوجيا العربيّة هناك ثلاثة مستويات: أوّلا: نبحث في العلوم الطّبيعيّة إذا اتّفق العلماء والعلم على أن كلّ جدول دوري هو جدول، أو كلّ نبات هو كائن حيّ، أو كل إنسان هو كائن حيّ؛ فنبحث في العلم، إذا وافق العلم فليكن. وإن لم يكن هناك جوابا في العلم؛ فنبحث في الأدبيّات الفلسفيّة مثلا: ما هو الوقت؟، وهل كلّ ساعة هي وقت؟، وهل كلّ زمان هو وقت؟، أم كلّ وقت هو زمان؟، وما هو المكان؟، وإلى آخره. هذه قضايا لم يتناولها العلم الطّبيعي البحت، ولكن تناولتها الفلسفة؛ فنرجع بذلك في حالة عدم وجود شيء في العلم إلى الأدبيّات الفلسفيّة.أما القضايا الّتي لم يجب عليها العلم، ولا الفلسفة. وبالتّالي لدينا مستوى ثالث مثلما ال(WordNet)، نرجع إلى ما يتّفق عليه اللّغويّون.وهذه القضايا الجوهريّة تفرّق الأنطولوجيا العربيّة عن الإنجليزيّة. بالإضافة إلى قضايا أخرى حتّى وإن كانت شكليّة مثل: طريقة تعريف المعنى (The mean Gloss).
– ما أهميّة المنهج التّأصيلي لأنطولوجيا اللّغة العربيّة؟
– أوّلا: المنهج التّأصيلي نقصد به أن تعكس أنطولوجيا اللّغة العربيّة المفاهيم العربيّة كما يفكّر بها العرب، ولا تكون تعريفات المفاهيم مترجمة من أيّ لغة أخرى.
ثانيا:أنطولوجيا اللّغة العربيّة تتميّز عن غيرها بما فيها تأثير يخصّها، ونعتقد أنّها تفوق ما تمّ عمله للغات أخرى، وكما أسلفنا هذه المنهجيّة ترتكز على أوّلا علم المنطق. مثلا: ماذا تعني علاقة (جنس من)، وعدّها كمجموعة جزئيّة. كمفهوم الجدول الدّوري هو جنس من مفهوم جدول، وكان مفهوم جدول هو جنس من مفهوم مصفوفة. كذلك يعني أنّ كلّ جدول دوري في الدّنيا هو بالضرورة جدول، وهو بالضّرورة كذلك في مجموعة جدول، نسمّي ذلك (Synset relation)، أو مجموعة جزئيّة. فالأنطولوجيا العربيّة لها تأثير منطقي، كما أنّ للأنطولوجيا العربيّة تأصيل فلسفي حيث تمّ بناء شجرة صغيرة نسمّيها المستويات العليا للأنطولوجيا العربيّة، وهي شجرة صغيرة تعكس، أو تشجّر، أو تصنّف أمهات المعاني للكلمات العربيّة، وبالتّالي إذا تمّ اتّباع هذه المنهجيّة؛ فإنّ تصنيف المفاهيم في المستويات الأقل يكون أكثر صحّة، بمعنى آخر أنّ الأنطولوجيا العليا الّتي قمنا ببنائها هي ستحكم صحّة المفاهيم الدّنيا، كما أنّ لتعريف المفهوم هناك منهجيّة خاصّة نتّبعها، هي خاصّة بنا، وهي من إبداعات المعهد.فعند تعريف شيء يجب الرّجوع إلى موقع مشروع الأنطولوجيا العربيّة؛ لفهم المزيد من القضايا.
– كيف ترى المستقبل لمشروع الأنطولوجيا العربيّة؟، وما هي الصّعوبات الّتي واجهتكم في الثلاث سنوات الأولى من عمر المشروع؟
– عندما تحوسبون المعاجم، بمعنى إعادة رقمنة المعاجم العربيّة الموجودة هي لها منهجيّة معيّنة –كما قلت سابقا- الاشتقاقات، والأسماء، وما يتفرّع عن المادّة اللّغويّة. ألا تجدون صعوبة في إعادة نمذجة هذه المعاجم؛ لتلائم بيئة العمل في أنطولوجيا اللّغةالعربيّة؟
– بالفعل يعني كان تحدّيا كبيرا جدّا عندما قمنا بتوحيد، ودمج المعاجم، وأودّ التّأكيد هنا بأنّ رقمنه، وتوحيد المعاجم هو ليس الأنطولوجيا العربيّة، هو شيء آخر نستعمله داخليّا، يعني اللّغويّون في معهد ابن سينا يستعملوا ذلك بطريقة غير مباشرة، وما أقصده أنّ توحيد المعاجم بحد ذاته هو تحدي كبير جدّا. فمثلا: كلمة (إجازة)، قد تكون بهمزة، وقد تكون بغير همزة، قد تكون مشكّلة، وقد تكون غير مشكّلة، قد تنتهي بتاء، وقد تنتهي بهاء، إلى آخره. فإذا كانت هذه المدخلات مختلفة من معجم إلى آخر. كيف يمكننا أن نوحّد هذه المعاجم بطريقة آليّة؟. بالطّبع أنا أشكر فريق العمل في المعهد الّذي أبدع في إيجاد لوغاريتمات أدّت إلى توحيد المعاجم بطريقة آليّة إلى حدّ يفوق 90%، كما من الصّعوبة البالغة جدّا كيفيّة توحيد معاني الكلمات، أقصدالشروحات بحيث لا يكون هناك تكرار مثلا: كلمة (إجازة) في معجم معرّفة، وكذلك في المعجم الآخر معرّفة. كيف يمكن لنا أن نكشف آليّا أنّ التّعريفين نفس التّعريف، ولكن بكلمات أخرى؟. وهنا تمثّلتإبداعات القائمين في المعهد بحلّ هذه القضيّة. لقد تغلّبنا على هذه القضايا إلى حد كبير. ولكن أصبحت عمليّة بناء الأنطولوجيا أسهل بكثير. بالرّغم من أنّ هناك العديد من الصّعوبات واجهتنا خاصّةباللّغة العربيّة فالكثيرة من القضايا لم تحل بعد، وهذا ما أخّرنا إلى بضعة سنوات عن بدء العمل بالأنطولوجيا.
– نعم، شكرا لك دكتور مصطفى، يسعدنا كثيرا أن تكون جهودكم سبّاقة، وناجحة، وفعّالة، في مشروع الأنطولوجيا العربيّة، كما نوجّه لكم موفور الشّكر لإتاحتك لنا هذه الفرصة للحديث معك حول مشروع الأنطولوجيا العربيّة.
– بارك الله فيك، والسّلام عليكم ورحمة الله وبركاته.
تم تسجيل الحوار يوم السبت