التنقيب على البيانات باستخدام قواعد الربط
عين شمس الهندسة هندسة الحاسبات والنظم الماجستير 2008 ولاء محمد مدحت عسل
"تعد قواعد المشاركة من أحد أهم فروع التنقيب عن البيانات و اكتشاف المعلومات. و يعد خوارزم ابريوري من أحد الخوارزميات الأساسية المقترحة و الذي يعتمد علي توليد مجموعة عناصر متكررة من مجموعة عناصر مشاركة. ومن أحد المشاكل التي ظهرت فى هذا الخوارزم الأعداد الكبيرة لقواعد المشاركة. و كان الحل لهذه المشكلة هى استنتاج قواعد المشاركة البسيطة. قاعدة مشاركة البسيطة هي قاعدة لها عنصر واحد في الجانب التالي. ومن المشاكل التى ظهرت ايضا أن هذه الخوارزميات تعطى حد أدنى واحد لكل العناصر بالرغم من طبيعتها المختلفة. ولهذا ظهرت الخوارزميات التي تعطى أكثر من حد أدنى للدعم لأنها تعطى حد أدنى مختلف لكل عنصر.
هذا العمل يقترح خوارزم جديد يجمع بين استخراج قواعد مشاركة بسيطة مع الخوارزميات التي تعطى أكثر من حد أدنى للدعم. ولقد تم تنفيذ هذا الخوارزمى و مقارنته بالخوارزميات التي سبقته باستخدام خوارزم جديد للمقارنة. وقد تمت المقارنات على مجموعتين مختلفتين من البيانات، أحدهما مجموعة بيانات حقيقية. و كانت المقارنات غلى اساس وقت التشغيل ، الدقة ، التعقيد و قياس الأهمية لكل خوارزمى.
بعد بناء نموذج التنقيب يجب اختبار صلاحية النموذج. حيث يتم تقسيم البيانات عشوائياً إلى مجموعتين منفصلتين من البيانات (تدريبية و اختباريه). ويتم اختبار الدقة بعد تقسيم البيانات إلى هذه النسب (10%-90%) و (20%-80%) و (30%-70%).
تظهر نتائج تطبيق الخوارزم المقترح أداء أسرع من الخوارزميات الأخرى مع الاحتفاظ بالدقة."
مشاركة عبر
أخر الإضافات
أخر الملخصات المضافة