"اسلوب الفئات التقريبيه لاكتشاف المعرفه من مناجم البيانات"
صفيه عباس محمود عين شمس الحاسيات و المعلومات علوم الحاسب الماجستير 2003
تربط عملية إكتشاف المعلومات العديد من الأساليب معا, مثل نظرية تعليم الألات , نظرية الإحتمالات, إسلوب التعرف على الأشياء, نظرية الفئات الغير محددة, و نظرية الفئات التقريبية و ذلك لإستخراج المعلومات من قواعد البيانات ذات الحجم الكبير, لتوضيح ظاهرة معينة أو دعم قرار ما, مما يجعل فهم هذة البيانات أكثر سهولة.
إسلوب الفئات التقريبية يعتبر إسلوب جديد لمعرفة المعلومات و هو إسلوب رياضى يتعامل مع البيانات الغير مؤكدة, من أهم مزايا هذا الإسلوب أنه لا يحتاج أى معلومات إضافية غير البيانات الموجودة, و يتم وضع البرامج التى تستخدم هذا الإسلوب على أجهزة كمبيوتر ذات نظام متوازى بسهولة, و قد ثبت أهمية هذا الإسلوب فى بعض التطبيقات العملية مثل الصيدلة, الطب, الهندسة, التحاليل الإقتصادية, و البنوك.
يعتبر مرض الجلطة الدموية من أهم و أخطر أمراض العصر و من الأمراض التى تؤدى إلى الوفاة, و هو زيادة نسبة تجلط الدم الذى يؤدى إلى تجلط الشرايين الدموية فيمنع مرور الدم إلى باقى أنحاء الجسم فيؤدى إلى الوفاة.
لهذا تم توظيف عملية إكتشاف المعلومات بإستخدام نظرية الفئات التقريبية على بيانات حقيقية تصف مرض الجلطة الدموية و حجم هذة البيانات 20 ميجا بايت, وكانت الأهداف من هذا التوظيف هى:
1. البحث عن عينات تؤثر فى مرض الجلطة الدموية و ذلك بعمل بعض الإحصاءات على المعلومات الناتجة من تطبيق نظرية الفئات التقريبية.
2. إستخدام خوارزميات القرارات و تطبيق شروطها لعمل تصنيف لقواعد البيانات و الحصول على بعض الناتئج على شكل قواعد مشرطة""if … then …"" و المصاحب لها عوامل تأكدية.
و قد تم إستخدام نظرية الفئات التقريبية لقدرتها على تخفيض عدد السجلات التى تشرح قواعد البيانات.
بتوظيف هذة النظرية إتضح أن عدد السجلات التى تصف قواعد البيانات لهذا المرض يمكن تخفيض عددها من 60 إلى 16 سجل. و بعمل بعض الإحصاءات على المعلومات الناتجة تم إكتشاف 14 عينة تؤتر فى مرض الجلطة الدموية, و بعض من هذة الناتائج كالأتى:
- إرتفاع معدل السجل ""aCL_IgM"" يؤدى إلى زيادة نسبة الإحتمال بالإصابة بمرض الجلطة الدموية.
- عندما تكون قيمة السجل ""ANA_Pattern"" مساوية ""S"",""P"",""S,P"" يؤدى إلى ضعف الإحتمال بالإصابة بالمرض.
- عندما يكون السجل ""Diagnosis"" فارغ, يؤدى هذا إلى ضعف الإحتمال من المعاناة من هذا المرض.
أخيراً, بعد دراسة خوارزميات القرارات و تحقيق شروطها على المعلومات التى تم الحصول عليها من تطبيق نظرية الفئات التقريبية. تم إكتشاف 21 قاعدة مشروطة ذات عوامل تأكيدية, بعض من هذة القواعد كالأتى:
- لو السجل ""ANA_Pattern"" يساوى القيم ""P,S"" و ""S,P"" و السجل 0£""aCL_IgM""£1.5 هذا يؤدى إلى عدم وجود مرض الجلطة الدموية
عامل التأكد(100%) عدد الحالات (14)
- لو السجل ""Diagnosis"" يساوى القيمة ""Behcet"" و السجلات ""KCT=RVVT=LAC="" """" هذا يؤدى إلى عدم وجود مرض الجلطة الدموية
عامل التأكد(100%) عدد الحالات 10))
- لو السجل ""Symptoms"" يساوى القيمة ""CNS iupus"" هذا يؤدى إلى م وجود مرض الجلطة الدموية بدرجة(2)
عامل التأكد(100%) عدد الحالات 18))
الكثير من هذة القواعد يمكن الحصول عليها بعمل تداخلات أكتر بين السجلات لوصف مرض الجلطة الدموية إعتماداً على هذة السجلات."
انشء في: ثلاثاء 1 يناير 2013 15:54
مشاركة عبر
أخر الإضافات
أخر الملخصات المضافة