اسلوب مهجن للتعرف علي الحروف يعتمد علي خوارزم الشبكات العصبيه الاصطناعيه ومنطق القواعد المبهمه (Fuzzy)

عين شمس الحاسبات و المعلومات علوم الحاسب الماجستير 2003 محمد خميس حسين ابو السعود

 

                

              "إن مجال التعرف على الحروف يعنى تحويل صور الحروف الناتجة من الماسح الضوئي سواء المكتوبة بخط اليد او المطبوعة إلى شكل أخر يسهل التعامل معه عن طريق الحاسب. ويعتبر التعرف على الحروف من الأمور الهامة والأساسية فى كثير من تطبيقات اللغة العربية مثل : استخدامه فى ميكنة النظم المكتبية , واستخدامه فى حفظ واسترجاع الأعمال الكتابية والمخطوطات القيمة , وتطبيقاته فى نظام الماسح الضوئي للتعرف على المستندات , وكذا استخدامه فى مساعدة المكفوفين. وتؤكد الدلائل أن هناك أكثر من مليار شخص يستخدم الحروف العربية بصور متعددة مما حث الأبحاث إلى الاهتمام حديثا بدراسة خواص وطبيعة هذه الحروف فى محاولة جادة لتطوير نظم للتعرف عليها.

هذه المهمة ليست سهله , حيث أن حروف اللغة العربية لها ملامح وخواص مميزه إذ تتعدد هذه الحروف شكلا و مقياسا ونوعا وقد تظهر فى أربعة أشكال مختلفة طبقا لموقعها فى الكلمة , وأخيرا فإن هذه الحروف يمكن أن تحتوى على نقاط ( نقطه واحدة , اثنان أو ثلاثة ) وكذلك حروف مزدوجة بأشكال متنوعة بالاضافه إلى انه يمكن الكتابة بأنواع مختلفة من الخطوط العربية مثل ( الخط النسخ و الخط الرقعه ). والخط الرقعة يحتوى على حروف متداخلة رأسيا و أفقيا مما يجعل عملية التعرف على الحروف صعبه.

                ونظرا للتحدى الكبير لكون هذه الحروف متصلة دائما سواء كانت مكتوبة بخط اليد أو الطابعة, فإن مجال الأبحاث فى هذا المضمار مازال واسعا , وتعتبر هذه الرسالة محاولة جادة لدراسة هذا الموضوع  وتطوير طريقه جديده للتعرف على هذه الحروف المعقدة.

ويحتوى المعرف المقترح بهذه الدراسة جزئيين رئيسيين :

·              جزء مرحلة الإعداد , الجزء الخاص بتقسيم الكلمة واستخلاص ملامحها الخاصة.

·              الجزء الخاص بالتعرف على الحروف.

ويعتبر الجزء الخاص بتقسيم الكلمة واستخلاص ملامحها الخاصة قلب هذه الدراسة , حيث يقدم أسلوب جديد غير تقليدي لتقنية تقسيم كلمات اللغة العربية إلى حروف دون الحاجة إلى استخدام آي من طرق التنحيف , أو طرق التفريغ , أو متابعة منحنى الحروف , أو التجزيء وأيضا لها القدرة على تقطيع الحروف المتداخلة سواء رأسيا أو أفقيا ويعتمد الأسلوب المستحدث على خوار زم الإسقاط الراسي والأفقي للسطر المكتوب والمراد تقسيمه وذلك لتحديد النقاط المبدئية للتقسيم للحروف الغير متداخلة. ويعتمد أيضا على خوار زم الإسقاط المائل وذلك لتحديد موضع الحروف المتداخلة. وتم تطبيق الخوار زم المقترح وتجربته من خلال 400 كلمه مكتوبين بخط اليد من خلال أشخاص مختلفة وكانت النتيجة أن الخوار زم المقترح استطاع تقسيم 95.3% من الحروف بطريقه صحيحه.

وقد تم استخدام الخوار زم المطبق في تكوين قاعدة البيانات للحروف المقسمة للاستعانة بها فى تدريب المعرف المقترح فى هذه الدراسة للتعرف على الحروف.

والجزء الخاص بالتعرف على الحروف فقد تم تصميم طريقه مهجنه من الشبكات العصبية الاصطناعية ومنطق القواعد المبهمة. ففي مرحلة التدريب تستخدم الشبكات العصبية في تكوين القواعد المبهمة. وفى مرحلة التعرف على الحروف يتم استخدام القواعد المبهمة للتعرف على الحروف و الحروف الغير معروفه يتم التعرف عليها من خلال الشبكات العصبية.

                وقد استعانت الدراسة بتجارب عملية على النظام المقترح لتأكيد النموذج والبرامج التى تم تطويرها واستخدمت فى ذلك بيانات إدخال تحتوى حوالي 40133 حرف مكتوب بخط اليد مقسمين إلى 20142 حرف مستخدمين في التدريب و 20891 حرف مستخدمين في أختبار النظام المقترح والحروف تم تقطيعها بواسطة الخوار زم الذي تم تطويره وتم استخدام البيانات في الاختبار بغرض الحصول على معرف مناسب للحروف العربية المكتوبة بخط اليد متضمنا الحروف المزدوجة المتداخلة.

وتم تطوير شبكه عصبيه أصطناعيه من نوع  SOMودراسة أداء الشبكه باستخدام أعداد مختلفة من الحروف في التدريب وشبكات ذات أحجام مختلفة وتم تسجيل أعلى نسبه من التعرف على الحروف من شبكه ذات حجم 30 ´ 30  وهى بمقدار 84.7%.

 وتم تطبيق النظام المهجن وتدريبه واختباره بواسطة هذه قاعدة البيانات على احجام مختلفه من الشبكات العصبيه و أعطى نتيجة جيده في التعرف على الحروف تساوى 94.6% باستخدام شبكه عصبيه ذات حجم 30 ´ 30.

                تختتم الرسالة بعرض خلاصة الاستنتاجات التي تضمنتها الرسالة وعرض المقترحات والتعديلات المستقبلية لتطوير النظام المقترح."


انشء في: أحد 19 فبراير 2012 11:28
Category:
مشاركة عبر