نگاهی بر داده کاوی و کشف قوانین وابستگی

دسته بندي : فنی و مهندسی » کامپیوتر و IT
نگاهی بر داده کاوی و کشف قوانین وابستگی


چکیده:

با افزایش سیستمهای كامپیوتر و گسترش تكنولوژی اطلاعات , بحث اصلی در علم كامپیوتر از چگونگی جمع آوری اطلاعات به نحوه استفاده از اطلاعات منتقل شده است . سیستمهای داده كاوی ,این امكان را به كاربر می دهند كه بتواند انبوه داده های جمع آوری شده را تفسیر كنند و دانش نهفته در آن را استخراج نمایند .

داده كاوی به هر نوع كشف دانش و یا الگوی پنهان در پایگاه داده ها اطلاق می شود . امروزه داده کاوی به عنوان یکی از مهمترین مسائل هوش مصنوعی و پایگاه داده ، محققان بسیاری را به خود جذب کرده است . در این تحقیق ابتدا نگاه کلی بر داده کاوی ، استراتژیهای داده کاوی و... داریم ، سپس مسأله کشف قوانین وابستگی در پایگاه داده را به تفضیل بررسی کردیم و نگاهی به الگوریتمهای موجود برای آن داشتیم . سپس مسأله کشف قوانین وابستگی در پایگاه داده های پویا را مورد بحث قرار دادیم و الگوریتم های ارائه شده مربوطه را مطرح کردیم .



مقدمه :

هدف از این اراِئه و تحقیق بررسی روشهای مطرح داده كاوی است .داده كاوی هر نوع استخراج دانش و یا الگواز داده های موجود در پایگاه داده است كه این دانشها و الگوها ضمنی و مستتر در داده ها هستند ,از داده كاوی می توان جهت امور رده بندی (Classification ) و تخمین (Estimation) ,پیش بینی (Prediction) و خوشه بندی (Clustering)استفاده كرد .داده كاوی دارای محاسن فراوانی است . از مهمترین آن محاسن كشف كردن دانش نهفته در سیستم است كه به شناخت بهتر سیستم كمك می كند .به عنوان مثال می توان به استفاده تركیبی از روش خوشه بندی جهت تخصیص بودجه به دسته های مختلف از كتب اشاره كرد .

سیستمهای داده كاوی تقریبا از اوایل دهه 1990 مورد توجه قرار گرفتند . علت این امر نیز آن بود كه تا آن زمان سازمانها بیشتر در پی ایجاد سیستمهای عملیاتی كامپیوتری بودند كه به وسیله آنها بتوانند داده های موجود در سازمان خود را سازماندهی كنند . پس از ایجاد این سیستمها ,روزانه حجم زیادی از اطلاعات جمع آوری میشد كه تفسیر كردن آنها از عهده انسان خارج بود . به همین دلیل , نیاز به تكنیكی بود كه از میان انبوه داده معنی استخراج كند و داده كاوی به همین منظور ایجاد و رشد یافت .

بنابر این هدف اصلی از داده كاوی ,كشف دانش نهفته در محیط مورد بررسی است كه این دانش می تواند شكلهای گوناگونی داسته باشد . دانش استخراج شده می تواند به فرم الگوهای موجود در داده ها باشد كه كشف این الگوها منجر به شناخت بهتر سیستم نیز می شود . الگوهای استخراجی عموما بیانگر روابط بین ویژگیهای سیستم هستند بعنوان مثال در سیستم تجاری یك الگو می تواند بیانگر رابطه بین نوع كالا و میزان تقاضای آن باشد .

در این تحقیق داده كاوی مورد بحث قرار می گیرد . علل استفاده از داده كاوی و منابعی كه داده كاوی بر روی آنها اعمال می شود ,علاوه بر این خلاصه ای از روشهای رایج داده كاوی ارائه شده است . تكنیكهای داده كاوی و قوانین وابستگی و الگوریتمهای موجود (Apriori , Aprior TID, Partition, Eclat ,Max Eclat , Vector ) و الگوریتم با ساختار Trie وfp grow و الگوریتمهای كاهشی مورد بررسی قرار می گیرند و در هر مورد مثالها , موارد كاربرد ,تكنیكها و نقاط قوت و ضعف مورد بررسی قرار گرفته اند .
دسته بندی: فنی و مهندسی » کامپیوتر و IT

تعداد مشاهده: 1687 مشاهده

فرمت فایل دانلودی:.zip

فرمت فایل اصلی: ورد و قابل ویرایش

تعداد صفحات: 27

حجم فایل:274 کیلوبایت

 قیمت: 24,900 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • محتوای فایل دانلودی: