دانلود پایان نامه : بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه مدلی مبتنی بر سیستم‌های چند عامله برای آن

دانلود متن کامل پایان نامه مقطع کارشناسی ارشد رشته فناوری اطلاعات

گرایش : مهندسی فناوری اطلاعات

عنوان : بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه مدلی مبتنی بر سیستم‌های چند عامله برای آن

وزارت علوم، تحقیقات و فناوری

دانشگاه علوم و فنون مازندران

 

پایان‌نامه

مقطع کارشناسی ارشد

 

رشته: فناوری اطلاعات- گرایش مهندسی فناوری اطلاعات

 

عنوان: بررسی قوانین انجمنی در داده کاوی توزیع شده و ارائه مدلی مبتنی بر سیستم‌های چند عامله برای آن

 

استاد راهنما: دکتر جواد وحیدی

استاد مشاور: دکتر بابک شیرازی

(زمستان 1391)

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده

 

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره‌گیری از روش‌هایی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غیرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است. داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. سه هدف اصلی برای داده کاوی از سیستم‌های اطلاعاتی توزیع شده وجود دارد: 1) شناسایی الگوهای مهم محلی در پایگاه داده‌های مجزا، 2) ادغام الگوهای محلی و استخراج الگوهای کلی پس از یکپارچه شدن پایگاه داده‌های توزیع شده، و 3) شناسایی الگوهای رابطه‌ای خاص در مجموعه داده‌های مختلف.

با توجه به قابلیت‌های عامل و سیستم‌های چندعامله و مناسب بودن آن‌ها برای محیط‌های توزیع شده به نظر می‌رسد که بتوان از قابلیت‌های آنها برای داده‌کاوی در محیط‌های توزیع شده بهره برد. در این تحقیق ما قصد داریم تا ضمن بررسی کارهای موجود در زمینه کاربرد عامل و سیستم‌های چندعامله در داده‌کاوی، بحث کاوش قوانین انجمنی در محیط‌های توزیع شده را مورد بررسی قرار دهیم. ما مساله خود را در دو فاز مورد بررسی قرار خواهیم داد. در فاز اول خصوصیت‌ها و قابلیت‌های یک عامل و مزایای ترکیب تکنولوژی چند عامله با داده‌کاوی توزیع شده مورد بررسی قرار خواهند گرفت، و در فاز دوم یک معماری برای داده‌کاوی در محیط‌های توزیع شده برپایه‌ی تکنولوژی چند عامله ارائه می‌دهیم. بطور کلی دستاورد اصلی این تحقیق ارائه یک رویکرد مبتنی بر عامل برای مساله کاوش قوانین انجمنی با استفاده از قابلیت‌های هدفگرایی، هوشمندی، یادگیری و استدلال است.

 

 

کلمات کلیدی: داده کاوی توزیع شده، سیستم چند عامله، قوانین انجمنی

فهرست رئوس مطالب

فصل اول مقدمه و کلیات تحقیق. 1

1-1- مقدمه 2

1-2- تعریف مسأله و سوالات اصلی تحقیق. 2

1-3- اهمیت و ضرورت انجام تحقیق. 3

1-4- اهداف اساسی از انجام تحقیق. 3

1-4-1- هدف اصلی. 3

1-4-2- اهداف فرعی. 3

1-5- پرسش‌های تحقیق. 4

1-5-1- پرسش اصلی. 4

1-5-2- پرسش‌های فرعی. 4

1-6- فرضیه‌ها 4

1-7- روش تحقیق. 4

1-8- جنبه‌های نوآوری. 5

1-9- مراحل انجام تحقیق. 5

1-10- ساختار پایان‌نامه 5

فصل دوم ادبیات و پیشینه تحقیق. 6

2-1- مقدمه 7

2-2- داده‌کاوی. 7

2-2-1- خوشه‌بندی. 8

2-2-1-1- روش‌های تقسیم‌بندی. 8

2-2-1-2- روش‌های سلسله مراتبی. 8

2-2-1-3- روش‌های مبتنی بر چگالی. 9

2-2-2- طبقه‌بندی. 9

2-2-2-1- طبقه‌بندی مبتنی بر قواعد. 10

2-2-3- کشف قواعد انجمنی. 12

2-2-3-1- تعاریف و مفاهیم اصلی در قواعد انجمنی. 12

2-2-3-1-1- تقسیم بندی قواعد انجمنی. 14

2-2-3-1-2- استخراج قواعد تک‌سطحی تک بعدی دودویی. 14

2-2-3-1-2-1- مرحله پیوست.. 16

2-2-3-1-2-2- مرحله هرس.. 17

2-2-3-1-3- محاسبه اطمینان و استخراج قواعد نهایی. 17

2-3- داده‌کاوی توزیع شده 17

2-4- عامل‌ها و سیستم‌های چندعامله 18

2-4-1- عامل. 19

2-4-1-1- مقایسه عامل با شیء 20

2-4-1-2- معماری عامل‌ها 23

2-4-1-2-1-  معماری BDI 24

2-4-2- سیستم‌های چندعامله 25

2-4-2-1- مذاکره 28

2-5- بهره‌گیری از عامل برای داده‌کاوی. 30

2-5-1- سیستم‌های چندعامله، بستری برای داده‌کاوی توزیع شده 30

2-6- مروری بر کارهای انجام شده 32

2-6-1- داده‌کاوی توزیع شده 33

2-6-2- کارهای مهم انجام شده در زمینه داده‌کاوی با استفاده از عامل. 36

2-7- جمع‌بندی. 39

فصل سوم روش تحقیق. 40

3-1- مقدمه 41

3-2- داده‌کاوی توزیع شده 41

3-2-1- گروه‌بندی مدل‌های داده‌کاوی توزیع شده 42

3-2-2- مشکلات داده‌کاوی توزیع شده 43

3-2-2-1- افزونگی داده 43

3-2-2-2- تغییرات پویای محیط.. 43

3-2-2-3- سربار ارتباطات.. 44

3-2-2-4- مشکلات داده‌کاوی توزیع شده به روش سنتی. 44

3-3- عامل‌ها و داده‌کاوی. 44

3-3-1- حوزه کاوش عامل. 46

3-3-2- داده‌کاوی برپایه‌ی عامل. 48

3-3-3- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی. 50

3-3-3-1- زیرساخت داده‌کاوی سازمانی. 51

3-3-3-2- بکارگیری هوشمندی انسان و دامنه 51

3-3-3-3- پشتیبانی از کاوش توزیع شده و موازی. 51

3-3-3-4- پیش پردازش داده 52

3-3-3-5- یادگیری سازگار 52

3-3-3-6- کاوش تعاملی. 52

3-3-4- داده‌کاوی توزیع شده برپایه‌ی عامل‌ها 53

3-3-4-1- چالش‌های داده‌کاوی توزیع شده 53

3-3-5- مزیت بهره‌گیری از عامل‌ها در داده‌کاوی توزیع شده 55

3-3-5-1- ایزوله بودن منابع داده 55

3-3-5-2- پویایی منابع داده و دستگاه‌های محاسباتی. 55

3-3-5-3- داده‌کاوی توزیع شده‌ی تعاملی. 56

3-3-5-4- انتخاب منابع و جمع‌اوری داده پویا 56

3-3-5-5- محدودیت‌های زمانی در منابع داده توزیع شده 56

3-3-5-6- داده‌کاوی توزیع شده با چند استراتژی. 56

3-3-5-7- داده‌کاوی توزیع شده‌ی مشارکتی. 56

3-3-5-8- پوشیدگی داده‌های منبع. 56

3-3-5-9- محدودیت‌های سازمانی در منابع داده توزیع شده 57

3-4- الگوریتم‌های کشف قوانین انجمنی. 57

3-4-1- الگوریتم AIS. 57

3-4-2- الگوریتم SETM.. 58

3-4-3- الگوریتم Apriori یا پیشینار 58

3-4-4- الگوریتم AprioriTid. 60

3-5- جمع‌بندی. 61

فصل چهارم محاسبات و یافته‌های تحقیق. 62

4-1- مقدمه 63

4-2- معماری پیشنهادی برای داده کاوی توزیع شده برپایه‌ی سیستم‌های چند عامله 66

4-2-1- معماری چهار لایه‌ی پیشنهادی. 66

4-2-1-1- لایه‌ی اول، لایه‌ی کاربر. 66

4-2-1-2- لایه‌ی دوم، لایه‌ی مدیریت.. 67

4-2-1-3- لایه‌ی سوم، لایه پردازش.. 68

4-2-1-4- لایه‌ی چهارم، لایه‌ی منابع. 69

4-3- مطالعه موردی. 71

4-3-1- تحلیل عملکرد الگوریتم‌های کشف قوانین انجمنی. 71

4-3-2- F-Trade: یک سیستم کاوش عامل برای سرویس‌های مالی. 75

4-3-3- داده‌کاوی چند منبع بر پایه‌ی عامل. 77

4-3-4- کاوش الگوی رفتار سازگار بر پایه‌ی عامل توسط HMM.. 81

4-3-4-1- چارچوب سیستم. 81

4-3-4-2- مدلسازی عامل. 83

4-4- جمع‌بندی. 84

فصل پنجم نتیجه‌گیری و پیشنهادات.. 86

5-1- مقدمه 87

5-2- خلاصه تحقیق. 87

5-3- پیشنهادات برای کارهای آتی. 87

پیوست منابع و مآخذ. 89

فهرست جداول و نمودارها

جدول 2- 1: ویژگی‌های یک عامل. 21

نمودار 4- 1: تغییرات رفتار الگوریتم‌های مختلف.. 73

نمودار 4- 2: تغییرات رفتار الگوریتم‌های مختلف در یک فروشگاه خرده فروشی. 74

نمودار 4- 3: مقایسه‌ی رفتار الگوریتم‌های AprioriTid و Apriori 74

نمودار 4- 4: مقایسه عملکرد الگوریتم‌هایAprioriTid ، Apriori Hybrid و Apriori در آزمایش‌های مختلف   75

فهرست تصاویر

شکل 2- 1: معماری BDI در عامل. 26

شکل 2- 2: درخت تحقیق مبحث داده‌کاوی. 33

شکل 3- 1:یک چارچوب داده‌کاوی توزیع شده 42

شکل 3- 2: گروه‌بندی سیستم‌های داده‌کاوی توزیع شده 43

شکل 3- 3: اشتراک عمل چند بعدی کاوش- عامل. 47

شکل 3- 4: الگوریتم Apriori 59

شکل 3- 5: توضیح الگوریتم Apriori 59

شکل 3- 6: الگوریتم AprioriTid. 60

شکل 4- 1: چارچوب تحقیقاتی کاوش- عامل. 64

شکل 4- 3: لایه‌ی کاربر. 66

شکل 4- 4: لایه‌ی مدیریت.. 67

شکل 4- 5: لایه‌ی پردازش.. 68

شکل 4- 6: لایه‌ی منابع. 69

شکل 4- 7: معماری پیشنهادی برای داده کاوی توزیع شده برپایه‌ی سیستم‌های چند عامله 70

شکل 4- 8: چارچوب F-Trade. 77

شکل 4- 9: چارچوب MSCM-AKD.. 78

شکل 4- 10: کاوش ترکیبی چند منبع بر پایه‌ی عامل. 80

شکل 4- 11: کاوش چند منبع با شبکه‌بندی بر پایه‌ی عامل. 81

شکل 4- 12: چارچوب کشف الگوی غیرعادی بر پایه‌ی عامل. 82

 

 

1-1- مقدمه

در این فصل به معرفی کلیات این پژوهش و ساختار آن می‌پردازیم. بدین منظور ابتدا به بیان تعریف مسئله، ضرورت، اهداف و پرسش‌های این تحقیق خواهیم پرداخت و در نهایت به تعریف واژه‌ها و اصطلاحات مورد استفاده در پایان نامه می‌پردازیم.

1-2- تعریف مسأله و سوالات اصلی تحقیق

امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آن‌ها سر و کار دارد، بهره‌گیری از روش‌هایی همچون داده‌کاوی برای استخراج دانش و اطلاعات نهفته در داده‌ها، امری غیرقابل اجتناب می‌باشد. یکی از مسائلی که امروزه در بحث داده‌کاوی مورد توجه قرار گرفته است، بحث توزیع‌شدگی ذاتی داده‌ها است. توسعه فناوری شبکه‌های کامپیوتری و تکنولوژی پایگاه داده توزیع شده، ذخیره سازی توزیع شده و نسل فنی جدیدی از داده کاوی توزیع شده را ترویج داده است.

داده‌کاوی توزیع شده عبارت است از کشف نیمه خودکار الگوهای پنهان موجود در داده‌ها، در حالتی که داده‌ها و یا مکانیزم‌های استنتاج، به صورت توزیع شده باشند. غیرمتمرکز بودن داده‌ها بدان معناست که داده‌ها به صورت توزیع شده بین دو یا چند سایت بوده و هزینه انتقال تمام یا بخشی از داده‌ها به یک سایت مرکزی، قابل صرف‌نظر نباشد. توزیع شده بودن مکانیزم‌های استنتاج، به معنای لزوم لحاظ کردن هزینه ارتباط بین مکانیزم‌های مختلف در حال استخراج دانش می‌باشد. این توزیع‌شدگی ممکن است به دلایل مختلفی از جمله ارائه شدن مکانیزم استخراج دانش در قالب یک سرویس اینترنتی و یا صرفاً ناشی از توزیع‌شدگی داده‌ها باشد. چنین رویکردی به داده‌کاوی، برخلاف جهت کلی تحقیقات انجام شده است که به طور عمده به تکنیک‌های متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه‌ای) داده‌های هدف متکی می‌باشند. مسائلی نظیر استخراج دانش در حالت عدم دسترسی به تمام داده‌های موجود، برقراری ارتباط موثر و بهینه با سایر مکانیزم‌های در حال استخراج دانش و نیز تبادل دانش یا اطلاعات میانی به جای اطلاعات خام، فقط تعدادی از مسائل اولیه داده‌کاوی توزیع شده با توجه به تعریف آن می‌باشند. بنابراین، داده‌کاوی توزیع شده در عین حال که به عنوان راه حلی کلیدی برای مشکلات اصلی پیش روی داده‌کاوی مطرح می‌باشد، خود سرمنشأ چالش‌ها و مسائل متعددی گردیده است؛ حل مؤثر این مشکلات منجر به استفاده هرچه بیشتر از داده‌کاوی و ایجاد امکانات جدید و بهره‌برداری از پتانسیل‌های موجود در قلمروهائی خواهد شد که علیرغم نیاز مبرم به داده‌کاوی، استفاده بسیار محدودی از آن به عمل می‌‌آورند.

 

1-3- اهمیت و ضرورت انجام تحقیق

داده کاوی توزیع شده از محاسبات توزیع شده استفاده می‌کند، و دانش مورد نیاز کاربران را از پایگاه داده‌های توزیع شده استخراج می‌کند. این حوزه چشم‌انداز کاربردی گسترده‌ای دارد. معمولاً پایگاه‌هایی که این داده‌ها را ایجاد یا دریافت می‌کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام به دنبال اهداف و منافع خود می‌باشند و حاضر نیستند دانش خود را به طور رایگان در اختیار دیگران قرار دهند. سیستم داده کاوی توزیع شده چند عامله، نسبتاً یک حوزه تحقیقاتی جدید است. با تکنولوژی نوظهور هوش مصنوعی سازگار است، انعطاف پذیری و هوشمندی خاصی دارد، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گیرد و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.

1-4- اهداف اساسی از انجام تحقیق

در اینجا اهداف تحقیق را به دو دسته هدف اصلی و اهداف فرعی تقسیم می­کنیم: “هدف کلی”  که منظور همان موضوع تحقیق است که قصد مشخص نمودن آن‌را داریم و به عبارتی آنچه در پایان مطالعه قصد رسیدن بدان را داریم. “هدف کلی”  معمولاً در یک جمله قابل فهم صریح و رسا و مختصر بیان می‌شود که برای خواننده گویا و قابل فهم است. در گونه دوم “اهداف جزئی یا اختصاصی” تحقیق بیان می‌شود. این اهداف از تقسیم یا شکستن “هدف کلی”  به اجزای کوچک‌تر بدست می‌آیند. اهداف جزئی راه رسیدن به  “هدف کلی” را قدم به قدم مشخص  می­نمایند.

1-4-1- هدف اصلی

ارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده

سیستم داده کاوی توزیع شده چند عامله، حوزه تحقیقاتی جدیدی است که با تکنولوژی نوظهور هوش مصنوعی سازگار بوده، انعطاف پذیری و هوشمندی خاصی داشته، استفاده از منابع را بهبود بخشیده و پایداری سیستم را افزایش داده است. و لذا ارائه مدلی مبتنی بر سیستم‌های چند عامله برای داده‌کاوی در محیط‌های توزیع شده در دستور کار قرار گرفت. نتایج این تحقیق می‌تواند در عمل مورد استفاده قرار گرفته و به عنوان یک موضوع پژوهشی مورد توجه قرار گیرد.

1-4-2- اهداف فرعی

  • بررسی قوانین انجمنی در چند مدل از داده کاوی
  • ارائه یک مدل مبتنی بر سیستم‌های چند عامله
  • ارزیابی مدل

1-5- پرسش‌های تحقیق

پرسش‌های تحقیق به دنبال چگونگی دست‌یابی به اهداف تحقیق می‌باشند. لذا مانند اهداف تحقیق، پرسش‌های تحقیق را نیز به دو دسته تقسیم می‌کنیم: پرسش اصلی و پرسش‌های فرعی. که “پرسش اصلی” به دنبال جوابی در راستای دست‌یابی به هدف اصلی تحقیق می‌باشد و “پرسش‌های فرعی” نیز به دنبال چگونگی دست یافتن به اهداف فرعی تحقیق هستند.

پرسش‌های تحقیق حاضر عبارتند از:

1-5-1- پرسش اصلی

  • استفاده از عامل‌ها و سیستم‌های چندعامله در داده کاوی توزیع شده چه اثراتی ایجاد می‌کند؟

1-5-2- پرسش‌های فرعی

  • چه روش‌هایی برای بهینه سازی الگوریتم‌های موجود، وجود دارد؟
  • عامل‌ها و سیستم‌های چندعامله در حوزه داده کاوی توزیع شده در چه کاربردهایی حائز اهمیت است؟
  • چه راه حل‌هایی را می‌توان برای رفع مشکلات موجود در این حوزه یافت؟

1-6- فرضیه‌ها

با توجه به قابلیت‌های به اثبات رسیده‌ی عامل‌ها و سیستم‌های چندعامله در زمینه‌های مختلف، فرض ما این است که عامل‌ها و سیستم‌های چندعامله می‌توانند به عنوان ابزار مناسبی در تأثیر بهبود کارایی الگوریتم‌های داده کاوی در محیط توزیع شده به کار گرفته شوند.

1-7- روش تحقیق

روش انجام تحقیق از طریق مطالعه الگوریتم‌ها و روش‌های مختلف موجود در راستای موضوع تحقیق می‌باشد. و نیز از طریق مقایسه با روش‌های مرتبط موجود انجام خواهد شد.

 

1-8- جنبه‌های نوآوری

با انجام این تحقیق می‌توان از تکنیک‌های داده کاوی در محیط‌های توزیع شده با سرعت و دقت بیشتری بهره برد.

1-9- مراحل انجام تحقیق

  • مطالعه‌ی اولیه و ادبیات مسأله
  • شناسایی و بیان کامل مسأله
  • بررسی فعالیت‌های پیشین در راستای حل مسأله
  • بهره‌گیری از نقاط قوت روش‌های مختلف و دست‌یابی به مدلی کارآمدتر
  • حل مسأله و تحلیل آن

1-10- ساختار پایان‌نامه

ساختار این تحقیق شامل پنج فصل است.

  • فصل یک: مقدمه و کلیات تحقیق ارائه خواهد شد و به تعریف مسئله و ضرورت انجام تحقیق خواهیم پرداخت.
  • فصل دوم: به بیان ادبیات و تاریخچه‌ای از داده کاوی، داده کاوی توزیع شده، عامل‌ها و سیستم‌های چندعامله پرداخته، چندین تکنیک رایج در این حوزه را ذکر می‌کنیم و کاربردها و خصوصیات آن‌ها را شرح خواهیم داد.
  • فصل سوم: به بیان روش تحقیق، نحوه‌ی گردآوری داده‌ها و شیوه‌ی تجزیه و تحلیل اطلاعات خواهیم پرداخت.
  • فصل چهارم: در این فصل، به بیان یافته­های تحقیق در هر یک از مراحل اجرایی تحقیق خواهیم پرداخت و در نهایت مدلی بر پایه سیستم‌های چند عامله به منظور بهبود سرعت و دقت عملیات داده‌کاوی در محیط‌های توزیع شده ارائه خواهیم داد.
  • فصل پنجم: در این فصل، به پرسش­های تحقیق پاسخ داده خواهد شد و پیشنهادهایی برای کارهای آینده ارائه می­شود.

 

تعداد صفحه : 107

قیمت : 14000تومان

بلافاصله پس از پرداخت ، لینک دانلود پایان نامه به شما نشان داده می شود

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت :        09199970560        info@arshadha.ir

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

شماره کارت :  6037997263131360 بانک ملی به نام محمد علی رودسرابی

11

مطالب مشابه را هم ببینید

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید