التعرّف البصري على صور الأحرف المسمارية (أبجدية أوغاريت)
يهدف البحث إلى تقديم مساهمة جديدة في عملية تطوير خوارزمية فعّالة لقراءة المخطوطات الأوغاريتية انطلاقاً من استخراج السّمات الشكلية والهندسية (Shape and Geometric Features) للحرف. يتمّ بداية تعرّف معالجة صورة النص للوصول إلى أقلّ قدر ممكن من الضجيج, و أعلى نسبة وضوح في الصورة مع تعديل السويات الر...
Saved in:
Main Authors: | , |
---|---|
Format: | Book |
Published: |
Tishreen University,
2020-10-01T00:00:00Z.
|
Subjects: | |
Online Access: | Connect to this object online. |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | يهدف البحث إلى تقديم مساهمة جديدة في عملية تطوير خوارزمية فعّالة لقراءة المخطوطات الأوغاريتية انطلاقاً من استخراج السّمات الشكلية والهندسية (Shape and Geometric Features) للحرف. يتمّ بداية تعرّف معالجة صورة النص للوصول إلى أقلّ قدر ممكن من الضجيج, و أعلى نسبة وضوح في الصورة مع تعديل السويات الرمادية عن طريق مساواة الهيستوغرام التكيفي (Adaptive Histogram Equalization ) يتم الحصول على صورة ثنائية بالاعتماد على التعتيب الديناميكي وفق خوارزمية أوتسو، يتمّ بعد ذلك تقطيع النص إلى الأسطر المكونة له , ثمّ إلى الأحرف المكوّنة لكلّ سطر بالاعتماد على العمليات المورفولوجية. يلي ذلك مرحلة استخلاص السّمات الهندسية والشكلية لكلّ حرف من الأحرف المقتطعة , ثم تحديد السمات الأكثر أهمية. وتسبق مرحلة التعرف مرحلة مهمّة وأساسية تُنفّذ لمرة واحدة عند تصميم البرنامج , وهي مرحلة التدريب Training التي تشكّل الأساس في عملية التعرف اللاحقة. يتمّ في هذه المرحلة إنتاج قاعدة لنماذج الأحرف المختلفة بأشكالها وحالاتها المتباينة. بعد عملية التعليم يكون قد تكَّون لدى نظام التعرف قاعدة معطيات لجميع الأشكال الأساسية المحتملة لورود الحرف. تُنظّم قاعدة المعطيات وتُخزّن لاستخدامها في المرحلة اللاّحقة. يتمّ في المرحلة الأخيرة التعرّف على صورة نصّ مخزّن كصورة اختبار، حيث يتمّ معالجة الصورة بنفس خطوات المعالجة المذكورة أعلاه, ثم تقطيع النصّ إلى الأسطر, ثمّ المحارف الأساسية، ثمّ استخلاص سمات الأحرف المقتطعة. تُقارن بعد ذلك سمات كل حرف مع سمات جميع النماذج الموجودة في قاعدة المعطيات المخزنة مسبقاً، ويُختبر مدى التشابه بينها اعتماداً على عدّة مصنفات مقترحة هي مصنف الشبكة العصبونية ومصنف SVM ومصنف المسافة الأصغري وصولاً لاختيار الحرف ذي قيمة التشابه الأكبر. تمّ الحصول من عملية تجزيء صور قاعدة الاختبار على 270 محرفاً من محارف اللغة المسمارية وكانت نسبة التجزيئ الصحيح97.4% , اختبر النظام على على تسعة سيناريوهات مختلفة وكان معدل التعرف 93.33% بزمن وسطي قدره 0.186 ثانية. |
---|---|
Item Description: | 2079-3081 2663-4279 |