"استخدام العلاقات الزمنية الفراغية لصهر البيانات والتنقيبات الخاصه بنظم المعلومات الجغرافية Using Spatio-Temporal Relationships For Data Fusion And Mining Of GIS"

أحمد عبد الرحمن عبد اللطيف عثمان عين شمس الحاسبات والمعلومات علوم الحاسب الماجستير 2007

 "ملخص الرسالة

 ان ظهور الاستشعار عن بعد المحاكاة العلمية والمسح التلسكوبى والتكنولوجيا الاخرى قد اثرى قدراتنا وامكانياتنا و ذلك لكى نستطيع جمع المعلومات الوقتية الموقعية وعلى كل حال فان التطور الهائل فى المعلومات من شانة ان يجعل الادارة والتحليل واستخدام المعلومات امرا صعبا و مكلفا. ان تطبيقات دعم اتخاذ القرار مع المعلومات الموقعية الوقتية من شانة ان يجعل الامر مهما لدراسة العلاقة المؤقتة للخصائص والمميزات التى تؤثر على اتخاذ القرار.

 

تقدم هذه الرسالة دراسة عن "" أستخدام العلاقات الزمنيه الفراغيه لصهر البيانات و التنقيبات   الخاصه بنظم المعلومات الجغرافيه"".

 

تتكون الرسالة من سبعة أبواب علي النحو التالي:

 

الباب الأول:  مقدمة

 

يستعرض هذا الباب باختصار مقدمه و تمهيد لموضوع البحث كما عرض أهداف البحث وما يحتويه من أبواب.

 

الباب الثاني: الدراسات السابقه

 

استعرض هذا الباب التعريفات المختلفه لنظم المعلومات الجغرافيه و صهر البيانات و التنقيبات الخاصه بنظم المعلومات الجغرافيه.  كما استعرض الأساليب و التقنيات التى  استخدمت مسبقا فى عمليات صهر البيانات الجغرافيه و التنقيبات الخاصه بالبيانات ذات الطبيعه الجغرافيه و اهم مشكلاتها.

 

الباب الثالث: نظام مقترح لصهر البيانات الجغرافيه

 

قدم هذا الباب مقترحا جديدا لصهر البيانات ذات الطبيعه الجغرافيه باستخدام خوارزم جديد سمى البحث الشجرى لاعتماده على تخزين البيانات فى شجره ثنائيه ثم مقارنة النتائج الناتجه عن اسلوب البحث الشجرى المقترح و النتائج الناتجه عن اسلوب البحث التشابهى المستخدم مسبقا بعد تطبيق كلا منهما على نفس البيانات فوجد ان الاسلوب المقترح يحقق نتائج ادق مستخدما عدد اقل من المقارنات و فى وقت اقل من الاسلوب القديم.

 

الباب الرابع: دعم اتخاذ القرار للبيانات الجغرافيه باستخدام نظام تنقيب مقترح للقواعد المترابطه

 

قدم هذا الباب مقترح جديد لتعديل أسلوب القواعد المترابطه المستخدم فى التنقيب عن البيانات الرقميه العاديه حتى يمكن استخدامه فى  التنقيب عن البيانات الجغرافيه ذات الطبيعه الخاصه و اخراج نتائج جيده و ذلك بادخال بعض المقاييس الاحصائيه عليه ليصبح ملائما للاستخدام مع البيانات الجغرافيه.

 

الباب الخامس: هيكل تنقيبى مقترح لدعم اتخاذ القرار باستخدام بيانات جغرافيه مصهوره

 

قدم الباحث نظام متكامل يتم فيه صهر البيانات الجغرافيه المنتشره فى اماكن مختلفه فى مكان واحد باستخدام الاسلوب المقترح فى الفصل الثالث ثم التنقيب عن البيانات التى تم صهرها باستخدام اسلوب القواعد المترابطه ثم دمج القواعد الناتجه فى نظام دعم اتخاذ قرار موجود مسبقا ليتم استنتاج قواعد جديده تسخدم فى  دعم اتخاذ القرار بشكل اشمل و اقوى.

 

الباب السادس: التجارب العملية والنتائج

 

استعرض هذا الباب التجارب التى تمت و النتائج التى تم الحصول عليها. بدأ هذا الفصل باستعراض البيانات التى تم العمل عليها. ثم استكمل هذا الفصل بمقارنة النتائج الناتجه عن اسلوب القواعد المترابطه المعدل و المقترح فى الفصل الرابع و النتائج الناتجه عن اسلوب القواعد المترابطه القديم  بعد تطبيق كلا منهما على نفس البيانات فوجد ان الاسلوب المقترح يقدم نتائج ذات معدل خطأ اقل و معدل فاقد اقل و يتم تنفيذة اسرع من الاسلوب القديم. فى نهاية الفصل تم تطبيق النظام المقترح فى الفصل الخامس على مجموعه من البيانات الجغرافيه واستخراج القواعد الناتجه و ادخالها على نظام دعم اتخاذ قرار موجود مسبقا لاستنتاج قواعد جديده و بعد مقارنة هذه القواعد الناتجه مع القواعد المقدمه بواسطة الخبير لنفس البيانات  وجد ان القواعد الناتجه عن النظام المقترح تقارب القواعد الناتجه عن النظام الخبير.

الباب السابع: الملخص

عرض هذا الباب خلاصة الرساله ومناقشة المقترحات التى قدمها الباحث و بخاصة ما تم عرضه تفصيليا فى الفصل الثالث و الرابع و الخامس.

       

Abstract

 

       

Many different database locations have to be searched to get complete geographical data about an object. The process of collecting  geographical data  from all resources and stores them in only one location is called Data Fusion. Similarity search algorithm is the most known algorithm for performing this kind of data fusion. This algorithm is based on searching and comparing   in all resources   sequentially which increase its complexity and wastes  a lot of  time, effort and space.

 

In  this thesis, we propose a proposed algorithm named tree algorithm to minimize the fusion complexity of GIS data. The proposed algorithm  is based on the simplicity of searching and comparing sorted trees. The resulting database can enhance the GIS description and reduce the search complexity.

 

This research introduces an evaluation of the proposed algorithm and   compares it with the similarity search algorithm.

 

The fusion process may results in large database after combining different databases in only one. Mining these large databases to extract knowledge from it is a complex process. The most popular data mining technique -association rules technique- has proved very efficient in mining theses large databases.  However, if the database to be mined has descriptive fields, as is the case in GIS databases, the technique may lead to wrong results. Some GIS fields have a special  nature that prevents their categorization (the process which the association rules technique depends on), and thus are not amenable for manipulation by the normal association rules  technique.  To overcome this deficiency, we propose in this research a modification to this technique.   

 

The modification is a new algorithm that depends on skipping the categorization steps in the normal association rules technique. The algorithm uses instead some statistical methods, such as the correlation coefficient.  

 

The modified technique is applied to a real GIS database--- the demographical database of the USA.  When compared with the expected results, the results obtained by the modified technique have proved twice as accurate as those obtained by the  normal technique.  

 

To give the results some practical value, they have been used to develop a tiny Decision Support Systems (DSS).  Namely, the extracted rules are incorporated in the decision making of GIS-related problems.

 

Decision support systems  play a very important  role in our every day life, since no one can live without taking  decisions  at home, work even in street. These  decisions must be based on perfect background and experience and previous studies in order to be valuable and  correct. Decisions with no pre-calculation and studies may lead to bad results.  Different data  have to be searched to get complete  view about any object which  consumes a lot of time. Data fusion is the process that combines the data found in many different locations in one location  so that all required data could be found in one place.

 

Data mining process is most used to get perfect data and knowledge about some thing,  usually in the process of pre-studying before the decision making process. Association rules technique is the most famous technique  for data mining as it generates  strong rules from large databases. These generated rules can then be used as pre-study knowledge that help in the decision support process.

 

In this thesis different GIS databases  are fused in only one. Association rules technique is then applied  in order to generate strong rules which are then combined in the decision support rules to induct new rules to be used in the decision making process. These extracted rules  are then  compared to those from experts systems."


انشء في: أحد 18 نوفمبر 2012 19:27
Category:
مشاركة عبر