Archived page!
About   |   Contact   |   Sitemap   |   Feedback

Interview with Dr. Mustafa Jarrar about the Arabic Ontology Project

Ms. Iman Daloul – a researcher from the Islamic University  – Gaza , conducted an interview with Dr. Mustafa Jarrar, the director of Sina Institute – Birzeit University about the Arabic Ontology project

حوار مسجّل مع الدّكتور مصطفى جرّار حول مشروع الانطولوجيا العربيّة

أجرت الأستاذة الباحثة إيمان صبحي دلّول من الجامعة الإسلاميّة في غزة حواراً مسجّلاً مع مدير معهد ابن سينا لهندسة المعرفة والتقنيات العربية-بيرزيت، الدكتور مصطفى جرّار. وكان نص الحوار كالآتي:

السّلام عليكم ورحمة الله تعالى وبركاته. الدّكتور مصطفى جرّار أستاذ مشارك في جامعة بيرزيت- فلسطين. ومدير معهد ابن سينا لهندسة المعرفة، والتّقنيّات العربيّة بنفس الجامعة. وهو مدير مشروع أنطولوجيا اللّغة العربيّة، والقائم عليه. مرحبا بك دكتور مصطفى.

–       حياكِ الله أستاذة إيمان، تشرفنا بكِ، وبالحديث حول مشروع الأنطولوجيا العربيّة.

شكرا لك دكتور مصطفى، بداية ما هي أنطولوجيا اللّغة العربيّة؟ ومتى ظهرت فكرتها؟

–       أنطولوجيا اللّغة العربيّة هي طريقة جديدة لتعريف المفاهيم، وتعريف معاني الكلمات العربيّة عن طريق تصنيفها، وتشجيرها، بحيث تكون الأنطولوجيا هي عبارة عن شجرة من معاني الكلمات العربيّة، وليست شجرة بكلمات اللّغة العربيّة. وهنا نقصد غالبيّة الكلمات العربيّة وليس جميعها.بدأت الفكرة تطبّق منذ عام 2009/2010م. والفكرة كانت موجودة منذ 2003م، ولكن لم يتاح لنا تطبيقها إلّا عندما عدت إلى جامعة بيرزيت.

نعم، كيف يمكن بناء أنطولوجيا للّغة العربيّة؟

–       يمكن بناء الأنطولوجيا العربيّة يدويّا بعدّة خطوات:

الخطوة الأولى: مسح (جمع) جميع كلمات اللّغة العربيّة.

الخطوة الثّانيّة: وضع المعاني المتعددة لكل كلمة؛ لأنّ كل كلمة في اللّغة العربيّة لها أكثر من معنى. فمثلا كلمة (العين) قد تعني العين عضو البصر، والعين بمعنى عين الماء، وإلى آخره. وهذا ما يسمّى المشترك اللّفظي في اللّغة العربيّة.

الخطوة الثّالثة: تصنيف المعاني تصنيفا مفاهيميّا. بواسطة علاقة نسميها علاقة (جنس من). مثلا: الإنسان هو جنس من الكائنات الحيّة. والرّجل هو جنس من إنسان.

ما علاقة أنطولوجيا اللّغة العربيّة بالمعاجم اللّغويّة؟

–       أنطولوجيا اللّغة العربيّة هي الجيل الجديد والحديث للمعاجم العربيّة. في الحقيقة المعاجم العربيّة غالبيتها يركّز على تصريف الكلام. فإذا سألنا عن معنى أكل. نقول: أكل يأكل أكلا؛ فهو آكل، وأكل الشّيء أي ابتلعه. ويمكننا أن نستدل على هذه المعاني والمقولات بأبيات من الشّعر، والآيات، والأحاديث، وإلى آخره. فلا تركّز معاجم اللّغة العربيّة على الصّفات الجوهريّة في تعريف معاني الكلمات. وهنا يأتي دور الأنطولوجيا أوّلا؛ لأنّها تصف معاني الكلمات وصفا دقيقا جدا، يركّز كما قلنا على الصّفات الجوهريّة الّتي تميّز المفهوم عن المفاهيم الأخرى. إضافة إلى ذلك فإنّ المعاجم العربيّة أصبح لها أهميّة، والمعاجم بشكل عام أصبح لها أهميّة كبرى في العصر الحديث، تستعمل في تطبيقات عديدة، كتطبيقاتها في محركات البحث.وتطبيقات أخرى يستفيد منها الإنسان، بالإضافة إلى الآلة.وبالتّالي فإنّ الأنطولوجيا تعتبر جيلا جديدا في هندسة المعاجم.

دكتور مصطفى، وضّح لنا بمثال بسيط، كيفيّة استخدام الأنطولوجيا؟

–       للأنطولوجيات اللّغويّة عدّة استخدامات، سأعدّد بعضا منها: مثلا: عند البحث عن بيانات ما، نستخدم محركات البحث. حيث يمكن لمحرّك البحث أن يستعمل الأنطولوجيا داخليّا؛ ليكون أكثر ذكاء. فإذا بحث الإنسان مثلا: عن كلمة (إجازة). سيرجّع محرّك البحث إلى أشياء لها علاقة بكلمة (عطلة) مثلا، ولا أقصد هنافقط المترادفات، ما أقصده هو استخدام شجرة الأنطولوجيا. وبالتّالي يصبح محرّك البحث أكثر ذكاء إذا استعملنا الأنطولوجيا في التّرجمة الآليّة؛ فتصبح المترجمات الآليّة أكثر دقّة لأنّه بإمكاننا ربط الأنطولوجيات اللّغويّة ربطا مفاهيميّا، وليس ترجمة. كما للأنطولوجيّات استخدام آخر فنستخدمها في تطبيقات نسميها ربط وتبادل البيانات، على سبيل المثال: كيف نستعمل الأنطولوجيا في بناء حكومة إلكترونيّة؟، يكون استعمالها في بعض المفاهيم على سبيل المثال كلمة (راتب)، موجودة في أكثر من قاعدة بيانات في الحكومة أو في أكثر من وزارة، وهناك العديد من المصطلحات والمفاهيم الّتي تربط هذه الكلمات في معاني موحّدة في قاموس موحّد. مثلا: كيف يتحدّث اثنين مع بعضهما، ويفهم بعضهما الآخر؟. في ذهن كلّ إنسان قاموس. والنّاس تفهم على بعضهم البعض حيث هناك مفاهيم مشتركة في قاموس أذهانهم. وبالتّالي مثل هذه الفكرة تستعمل عادة في ربط قواعد البيانات نسمّيها(Data integration and interoperability ()قواعد البيانات بنسمّيها perabilityفي ربط قواعد البيانات بنسمّيها ن إنسان لمّن إحنا نتحدّث بيكون في قاموس في ذهنه، والنّاس تفه) بمعنى توافقيّة البيانات، وتستعمل الأنطولوجيا في هذه التّطبيقات كمرجع للمفاهيم. وأذكر استعمال آخر للأنطولوجيا هو الجيل الثّالث للإنترنت، بمعنى قد نستعمل الأنطولوجيا كمعجم جديد من نوع آخر نسمّيه (Conceptual Dictionary). معجم مبني على أساس مفاهيمي ترتبط فيه الكلمات بطريقة مفاهيميّة. كما يمكن استعمال الأنطولوجيا كمرجع للإنسان وليس فقط للآلة.

ما مدى استفادة انطولوجيا اللّغة العربيّة من انطولوجيا اللّغة الإنجليزيّة (WordNet

–       ال(WordNet) أو ما نسميه بشبكة المترادفات الإنجليزيّة كانت في بداية الثّمانينات، أو في آخر الثّمانينات في جامعة برنستون في أمريكا، وطوّرها أناس غير متخصّصين،لا يشتغلون في الأنطولوجيا، ولا في علم المنطق، ولا حتّى في علم ال(IT) (تقنيّة المعلومات). لكنها طوّرت؛ لأغراض أخرى، واشتهرت هذه الأنطولوجيا. ولا تستفيد الأنطولوجيا العربيّة استفادة مباشرة من الأنطولوجيا الإنجليزيّة؛ بل قرّرنا في جامعة بيرزيت أن نتّبع نفس طريقة تمثيل البيانات؛ ليس لأنّ ال(WordNet) هو الأفضل، بل لشهرته؛ فقرّرنا اتّباع نفس منهجيّة تمثيل البيانات؛ لكي يتمّ الرّبط بين الأنطولوجيا العربيّة وال(WordNet)، وهناك تعاون وثيق بين القائمين على مشروع ال(WordNet) في برنستون ومعنا في جامعة بيرزيت؛ وذلك لربط الأنطولوجيا الإنجليزيّة بالأنطولوجيا العربيّة. كما أنّ هناك منهجيّة أخرى لا نسمّيها (Arabic WordNet) ولكن نسمّيها (Arabic Ontology)؛ لأنّن اتّبعنا منهجيّة خاصّة وجديدة، ومتطوّرة أكثر مقارنة بما تمّ في أنطولوجيا اللّغة الإنجليزيّة.

وما الّذي يميّز أنطولوجيا اللّغة العربيّة عن أنطولوجيا اللّغة الإنجليزيّة؟

–       الّذي يميّزها أوّلا: أنّها مؤسّسة، ومؤصّلة فلسفيّا ومنطقيّا، وهذا يعني أنّ ال(WordNet) لم يبنى على أساس علم المنطق. بينما الأنطولوجيا العربيّة مبنيّة على أساس علم المنطق، بالإضافة إلى ذلك هناك تأصيل فلسفي؛ لتصنيف المعاني فكما يعرّف تصنيف المعاني، الكلمات بأنّها قضايا فلسفيّة كبرى. فبالتّالي عند بناء الأنطولوجيا العربيّة يتمّ الرجوع إلى الأدبيّات الفلسفيّة العربيّة القديمة، وكذلك الحديثة، والأجنبيّة، وهذا لم يكن متاحا للفريق الّذي عمل على بناء الأنطولوجيا الإنجليزيّة، وبالتّالي نستطيع القول: بأنّ الأنطولوجيا العربيّة هي أكثر دقّة في تعريفها وتصنيفها للمعنى. فمثلا: عند تعريف الجدول الدّوري، نقول: هل كلّ جدول دوري هو جدول؟، في الأنطولوجيا الإنجليزيّة، يعني يتمّ الحكم على صحّة الادّعاء بأن كلّ جدول دوري هو جدول إذا قبل الناس ذلك، وهذا يعني أنّ اللّغويين هم من يحكمون على صحّة التّصنيف، بينما في الأنطولوجيا العربيّة هناك ثلاثة مستويات: أوّلا: نبحث في العلوم الطّبيعيّة إذا اتّفق العلماء والعلم على أن كلّ جدول دوري هو جدول، أو كلّ نبات هو كائن حيّ، أو كل إنسان هو كائن حيّ؛ فنبحث في العلم، إذا وافق  العلم فليكن. وإن لم يكن هناك جوابا في العلم؛ فنبحث في الأدبيّات الفلسفيّة مثلا: ما هو الوقت؟، وهل كلّ ساعة هي وقت؟، وهل كلّ زمان هو وقت؟، أم كلّ وقت هو زمان؟، وما هو المكان؟، وإلى آخره. هذه قضايا لم يتناولها العلم الطّبيعي البحت، ولكن تناولتها الفلسفة؛ فنرجع بذلك في حالة عدم وجود شيء في العلم إلى الأدبيّات الفلسفيّة.أما القضايا الّتي لم يجب عليها العلم، ولا الفلسفة. وبالتّالي لدينا مستوى ثالث مثلما ال(WordNet)، نرجع إلى ما يتّفق عليه اللّغويّون.وهذه القضايا الجوهريّة تفرّق الأنطولوجيا العربيّة عن الإنجليزيّة. بالإضافة إلى قضايا أخرى حتّى وإن كانت شكليّة مثل: طريقة تعريف المعنى (The mean Gloss).

ما أهميّة المنهج التّأصيلي لأنطولوجيا اللّغة العربيّة؟

–       أوّلا: المنهج التّأصيلي نقصد به أن تعكس أنطولوجيا اللّغة العربيّة المفاهيم العربيّة كما يفكّر بها العرب، ولا تكون تعريفات المفاهيم مترجمة من أيّ لغة أخرى.

ثانيا:أنطولوجيا اللّغة العربيّة تتميّز عن غيرها بما فيها تأثير يخصّها، ونعتقد أنّها تفوق ما تمّ عمله للغات أخرى، وكما أسلفنا هذه المنهجيّة ترتكز على أوّلا علم المنطق. مثلا: ماذا تعني علاقة (جنس من)، وعدّها كمجموعة جزئيّة. كمفهوم الجدول الدّوري هو جنس من مفهوم جدول، وكان مفهوم جدول هو جنس من مفهوم مصفوفة. كذلك يعني أنّ كلّ جدول دوري في الدّنيا هو بالضرورة جدول، وهو بالضّرورة كذلك في مجموعة جدول، نسمّي ذلك (Synset relation)، أو مجموعة جزئيّة. فالأنطولوجيا العربيّة لها تأثير منطقي، كما أنّ للأنطولوجيا العربيّة تأصيل فلسفي حيث تمّ بناء شجرة صغيرة نسمّيها المستويات العليا للأنطولوجيا العربيّة، وهي شجرة صغيرة تعكس، أو تشجّر، أو تصنّف أمهات المعاني للكلمات العربيّة، وبالتّالي إذا تمّ اتّباع هذه المنهجيّة؛ فإنّ تصنيف المفاهيم في المستويات الأقل يكون أكثر صحّة، بمعنى آخر أنّ الأنطولوجيا العليا الّتي قمنا ببنائها هي ستحكم صحّة المفاهيم الدّنيا، كما أنّ لتعريف المفهوم هناك منهجيّة خاصّة نتّبعها، هي خاصّة بنا، وهي من إبداعات المعهد.فعند تعريف شيء يجب الرّجوع إلى موقع مشروع الأنطولوجيا العربيّة؛ لفهم المزيد من القضايا.

كيف ترى المستقبل لمشروع الأنطولوجيا العربيّة؟، وما هي الصّعوبات الّتي واجهتكم في الثلاث سنوات الأولى من عمر المشروع؟

–        في الحقيقة الثّلاث سنوات الأولى من عمر المشروع ركّزت على قضيّتين، قبل أن أتحدث عن مستقبل الأنطولوجيا العربيّة.

أوّلا: لبناء الأنطولوجيا كان علينا أن نبني المستويات العليا لها، وهي لا تزيد عن 300 معنى(المعاني الأكثر تجريداً)، وهذا العدد من المعاني الأكثر صعوبة في بناء الأنطولوجيا؛ فإذا تمّ بناء هذه المعاني بشكل صحيح ستكون الأمور بعد ذلك أسهل وأسرع وأكثر دقّة، وهذ ما قام به العديد من الباحثين في المعهد ابن سينابجامعة بيرزيت على بناءالمستويات العليا للأنطولوجيا.

ثانيا:العقبة الثّانية الّتي واجهتنا هي عدم توفّر معاجم عربيّة محوسبة يمكننا الاستفادة منها فكان علينا أوّلا أن نقوم برقمنة، وتوحيد مئات المعاجم العربيّة.وهي موجودة في المكتبات، أو مصوّرة ومتوفّرة بصيغ الكتب الإلكترونيّة، وبالتّالي لا يمكننا الاستفادة منها بطريقة فعّالة. لذا وقمنا بهذه الخطوة لتلائم بيئة الأنطولوجيا. وهذه المعاجم كمعجم واحد تمّ بناؤه، ثمّ دمجنا جميع المعاجم مع بعضها، وبالتّالي نستطيع القول: منذ ثلاثة شهور بدأت عمليّة بناء الأنطولوجيا بشكل متسارع جدا، حيث يتمّ إضافة حوالي مئة إلى 300 مصطلح، أو مفهوم جديد يوميّا. فالعمليّة الآن أصبحت أسهل بكثير. ومستقبل الأنطولوجيا أنا أعتقد بأنّ الأنطولوجيا لن تستخدم فقط للقضايا الّتي أشرت إليها فقط، بل ستكون منهجيّة جديدة في التّعامل مع المعاجم بشكل عام فهي توجّه، وأكثر منه مشروعا بحد ذاته، وتوجّهها يتمثّل في إعادة تعريف الكلمات العربيّة، بمعنى إعادة هندسة المعاجم الموجودة. حيث هناك جهود حثيثة الآن في الوطن العربي قد بدأت، مثل بناء المعجم التّاريخي للّغة العربيّة، وكذلك بناء معجم تقني جديد. فنأمل أن يكون مستقبل الأنطولوجيا هو محور منهجي وليس فقط كمحتوى يوفّر منهجيّة جديدة لهندسة المعاجم العربيّة بشكل عام.

عندما تحوسبون المعاجم، بمعنى إعادة رقمنة المعاجم العربيّة الموجودة هي لها منهجيّة معيّنة –كما قلت سابقا- الاشتقاقات، والأسماء، وما يتفرّع عن المادّة اللّغويّة. ألا تجدون صعوبة في إعادة نمذجة  هذه المعاجم؛ لتلائم بيئة العمل في أنطولوجيا اللّغةالعربيّة؟

–       بالفعل يعني كان تحدّيا كبيرا جدّا عندما قمنا بتوحيد، ودمج المعاجم، وأودّ التّأكيد هنا بأنّ رقمنه، وتوحيد المعاجم هو ليس الأنطولوجيا العربيّة، هو شيء آخر نستعمله داخليّا، يعني اللّغويّون في معهد ابن سينا يستعملوا ذلك بطريقة غير مباشرة، وما أقصده أنّ توحيد المعاجم بحد ذاته هو تحدي كبير جدّا. فمثلا: كلمة (إجازة)، قد تكون بهمزة، وقد تكون بغير همزة، قد تكون مشكّلة، وقد تكون غير مشكّلة، قد تنتهي بتاء، وقد تنتهي بهاء، إلى آخره. فإذا كانت هذه المدخلات مختلفة من معجم إلى آخر. كيف يمكننا أن نوحّد هذه المعاجم بطريقة آليّة؟. بالطّبع أنا أشكر فريق العمل في المعهد الّذي أبدع في إيجاد لوغاريتمات أدّت إلى توحيد المعاجم بطريقة آليّة إلى حدّ يفوق 90%، كما من الصّعوبة البالغة جدّا كيفيّة توحيد معاني الكلمات، أقصدالشروحات بحيث لا يكون هناك تكرار مثلا: كلمة (إجازة) في معجم معرّفة، وكذلك في المعجم الآخر معرّفة. كيف يمكن لنا أن نكشف آليّا أنّ التّعريفين نفس التّعريف، ولكن بكلمات أخرى؟. وهنا تمثّلتإبداعات القائمين في المعهد بحلّ هذه القضيّة. لقد تغلّبنا على هذه القضايا إلى حد كبير. ولكن أصبحت عمليّة بناء الأنطولوجيا أسهل بكثير. بالرّغم من أنّ هناك العديد من الصّعوبات واجهتنا خاصّةباللّغة العربيّة فالكثيرة من القضايا لم تحل بعد، وهذا ما أخّرنا إلى بضعة سنوات عن بدء العمل بالأنطولوجيا.

نعم، شكرا لك دكتور مصطفى، يسعدنا كثيرا أن تكون جهودكم سبّاقة، وناجحة، وفعّالة، في مشروع الأنطولوجيا العربيّة، كما نوجّه لكم موفور الشّكر لإتاحتك لنا هذه الفرصة للحديث معك حول مشروع الأنطولوجيا العربيّة.

–       بارك الله فيك، والسّلام عليكم ورحمة الله وبركاته.

تم تسجيل الحوار يوم السبت


No comments yet.

Leave a Reply