دانلود پایان نامه ارشد : خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی

دانلود متن کامل پایان نامه مقطع کارشناسی ارشد رشته مهندسی فناوری اطلاعات

گرایش : مدیریت سیستم‌های اطلاعاتی

عنوان :  خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی

وزارت علوم، تحقیقات و فناوری

دانشگاه علوم و فنون مازندران

پایان نامه

مقطع کارشناسی ارشد

رشته : فناوری اطلاعات – مدیریت سیستم‌های اطلاعاتی

 

عنوان : خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی

استاد راهنما : جناب آقای دکتر بهروز مینایی

استاد مشاور : جناب آقای دکتر حسین علیزاده

تابستان 1392

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده

خوشه‌بندی وظیفه کاوش الگوهای پنهان در داده‌های بدون برچسب را بر عهده دارد. به خاطر پیچیدگی مسئله و ضعف روش‌های خوشه‌بندی پایه، امروزه روش‌های خوشه‌بندی ترکیبی مورد استفاده قرار می‌گیرند. به روشی از خوشه‌بندی ترکیبی که در آن از زیرمجموعه‌ای منتخب از نتایج اولیه برای ترکیب و ساخت نتیجه نهایی استفاده می‌شود خوشه‌بندی ترکیبی مبتنی بر انتخاب زیرمجموعه نتایج اولیه می‌گویند. در سال‌های اخیر تمرکز بر روی ارزیابی نتایج اولیه برای انتخاب خوشه در خوشه‌بندی ترکیبی مورد توجه محققین زیادی قرار گرفته است. اما پاسخ به بعضی از سؤالات در این زمینه همچنان با ابهامات زیادی روبروست. از طرفی دیگر، نظریه خرد جمعی که اولین بار توسط سورویکی منتشر شده است، نشان می‌دهد که قضاوت‌های جمعی و دموکراتیک از اعتبار بیشتری نسبت به آنچه که ما انتظار داشتیم برخوردار هستند. این نظریه چهار شرط پراکندگی، استقلال، عدم تمرکز و روش ترکیب مناسب آراء را برای هر جمعیت خردمند لازم و کافی می‌داند. هدف این تحقیق پیشنهاد فرآیندی جهت نگاشت و به‌کارگیری نظریه خرد جمعی در انتخاب زیرمجموعه مناسب در خوشه‌بندی ترکیبی مبتنی بر انتخاب می‌باشد. از این روی در این تحقیق ابتدا با استفاده از تعاریف مطرح‌شده در نظریه خرد جمعی باز تعریفی متناسب با خوشه‌بندی ترکیبی مبتنی بر انتخاب ارائه می‌شود و بر اساس آن دو روش برای ترکیب این دو مفهوم پیشنهاد می‌شود. در روش پیشنهادی اول الگوریتم‌های خوشه‌بندی اولیه غیر هم نام کاملاً مستقل فرض خواهند شد و برای ارزیابی استقلال الگوریتم‌های هم نام نیاز به آستانه‌گیری می‌باشد. در روش دوم، سعی شده است تا دو بخش از روش اول بهبود یابد. از این روی جهت مدل‌سازی الگوریتم‌ها و ارزیابی استقلال آن‌ها نسبت به هم یک روش مبتنی بر گراف کد الگوریتم ارائه می‌شود و میزان استقلال به دست آمده در این روش به عنوان وزنی برای ارزیابی پراکندگی در تشکیل جواب نهایی مورد استفاده قرار می‌گیرد. جهت بررسی ادعاهای این تحقیق در بخش ارزیابی دقت و اطلاعات متقابل نرمال شده‌ی روش‌های پیشنهادی بر روی داده‌ّهای استاندارد با روش‌های پایه، روش‌ ترکیب کامل و چند روش معروف خوشه‌بندی ترکیبی مبتنی بر انتخاب مقایسه می‌شوند که این مقایسه کاراریی بالای روش‌های پیشنهادی این تحقیق در اکثر موارد نسبت به سایر روش‌های مطرح شده را نشان می‌دهد. همچنین در بخش نتیجه‌گیری چندین روش توسعه جهت کارهای آتی‌ پیشنهاد می‌شود.

واژه‌های کلیدی: خوشه‌بندی ترکیبی، خرد جمعی، استقلال الگوریتم‌های خوشه‌بندی، پراکندگی نتایج خوشه‌بندی اولیه، عدم تمرکز در چهارچوب خوشه‌بندی ترکیبی

فهرست مطالب

فصل اول

  1. مقدمه 2

1-1. خوشه‌بندی 2

1-2. خوشه‌بندی ترکیبی 4

1-3. خرد جمعی 4

1-4. خوشه‌بندی مبتنی بر انتخاب بر اساس نظریه خرد جمعی 5

1-4-1- فرضیات تحقیق 6

فصل دوم

  1. مروری بر ادبیات تحقیق 9

2-1. مقدمه 9

2-2. خوشه‌بندی 9

2-2-1. الگوریتم‌های خوشه‌بندی پایه 9

2-2-1-1. الگوریتم‌های سلسله مراتبی 10

2-2-1-1-1. تعاریف و نماد‌ها 11

2-2-1-1-2. الگوریتم پیوندی منفرد 13

2-2-1-1-3. الگوریتم پیوندی کامل 13

2-2-1-1-4. الگوریتم پیوندی میانگین 14

2-2-1-1-5. الگوریتم پیوندی بخشی 15

2-2-1-2. الگوریتم‌های افرازبندی 15

2-2-1-2-1. الگوریتم K-means 16

2-2-1-2-2. الگوریتم FCM 17

2-2-1-2-3. الگوریتم طیفی 19

2-2-1-2-3-1. الگوریتم برش نرمال 20

2-2-1-2-3-2.  الگوریتم NJW 21

2-2-1-2-4. الگوریتم خوشه‌بندی کاهشی 22

2-2-1-2-5. الگوریتم خوشه‌بندی Median K-Flat 23

2-2-1-2-6. الگوریتم خوشه‌بندی مخلوط گوسی 25

2-2-2. معیارهای ارزیابی 27

2-2-2-1. معیار SSE 28

2-2-2-2. معیار اطلاعات متقابل نرمال شده 30

2-2-2-3. معیار APMM 32

2-۳. خوشه‌بندی ترکیبی 33

2-۳-1. ایجاد تنوع در خوشه‌بندی ترکیبی 34

2-۳-1-1. استفاده از الگوریتم‌های مختلف خوشه‌بندی ترکیبی 35

2-۳-1-2. تغییر پارامترهای اولیه خوشه‌بندی ترکیبی 35

2-۳-1-3. انتخاب یا تولید ویژگی‌های جدید 36

2-۳-1-4. انتخاب زیرمجموعه‌ای از مجموعه داده اصلی 36

2-۳-2. ترکیب نتایج با تابع توافقی 37

2-۳-2-1. روش مبتنی بر مدل مخلوط 37

2-۳-2-2. روش مبتنی بر ابر گراف 44

2-۳-2-2-1. روش CSPA 46

2-۳-2-2-2. روش HGPA 47

2-۳-2-2-3. روش MCLA 48

2-۳-2-3. روش‌های مبتنی بر ماتریس همبستگی 50

2-۳-2-3-1. الگوریتم‌های سلسله مراتبی تراکمی 51

2-۳-2-3-2. الگوریتم افرازبندی گراف با تکرار 52

2-3-3. الگوریتم‌های خوشه‌بندی ترکیبی کامل 56

2-4. خوشه‌بندی ترکیبی مبتنی بر انتخاب 56

2-4-1. خوشه‌بندی ترکیبی مبتنی بر انتخاب فرن و لین 57

2-4-1-1. تعریف معیار کیفیت در روش فرن و لین 57

2-۴-۱-2. تعریف معیار پراکندگی در روش فرن و لین 58

2-۴-۱-3. راهکار انتخاب خوشه‌ برای تشکیل نتیجه نهایی در روش فرن و لین 58

2-4-2. الگوریتم هوشمند طبقه‌بندی مجموعه داده‌ها 60

2-4-3. خوشه‌بندی ترکیبی طیفی مبتنی بر انتخاب بر اساس شباهت 61

2-4-3-1. معیار ارزیابی  در روش پیشنهادی ژیا 61

2-4-3-2. انتخاب خوشه‌بندی بر اساس قانون نزدیک‌ترین همسایه در روش ژیا 62

2-4-4. خوشه‌بندی ترکیبی انتخابی لی‌مین 64

2-4-4-1. انتخاب افراز مرجع در روش لی‌مین 64

2-4-4-2. راهکار انتخاب خوشه در روش‌ لی‌مین 66

2-4-4-3. چهارچوب الگوریتم خوشه‌بندی انتخابی لی‌مین 68

2-4-5. خوشه‌بندی بر اساس معیار MAX با استفاده از مجموعه‌ای از خوشه‌های یک افراز 69

2-4-5-1. راهکار ارزیابی خوشهی MAX 69

2-4-5-2. روش انباشت مدارک توسعهیافته 70

2-4-6. خوشه‌بندی بر اساس معیار APMM با استفاده از مجموعه‌ای از خوشه‌های یک افراز 70

2-5. روش بهترین افراز توافقی اعتبارسنجی شده 72

2-6. استفاده از نظریه خرد جمعی در علوم رایانه 73

 

فصل سوم

  1. روش تحقیق 76

3-1. مقدمه 76

3-2. نظریه خرد جمعی 77

3-2-1. شرایط جامعه خردمند 78

3-2-1-1. تعریف معیار پراکندگی 78

3-2-1-2. تعریف معیار استقلال 79

3-2-1-3. تعریف معیار عدم تمرکز 79

3-2-1-4. روش ترکیب مناسب 80

3-2-2. اهمیت و رابطه استقلال و پراکندگی در خرد جمعی 80

3-2-3. استثناءها در خرد جمعی 82

3-3. خوشه‌بندی خردمند با استفاده از آستانه‌گیری 82

3-3-1. روش ارزیابی پراکندگی نتایج 84

3-3-2. روش ارزیابی استقلال الگوریتم‌ها 85

3-3-3. عدم تمرکز در بخش‌های سازنده خوشه‌بندی ترکیبی 88

3-3-4. مکانیزم ترکیب مناسب 90

3-3-5. بررسی تأثیر مکانیزم بازخورد در کیفیت نتیجه نهایی 90

3-3-6. شبه کد خوشه‌بندی خردمند با استفاده از آستانه‌گیری 91

3-4. خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم 93

3-4-1. بررسی مکانیزم حل مسائل توسط الگوریتم‌های خوشه‌بندی 93

3-4-2. مدل‌سازی گراف استقلال الگوریتم 95

3-4-2-1. زبان استقلال الگوریتم‌ خوشه‌بندی 96

3-4-2-2. تبدیل کد به گراف استقلال الگوریتم 99

3-4-۲-۳. ارزیابی گراف استقلال الگوریتم 107

3-4-3. چهارچوب خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم 110

3-4-3-1. ارزیابی استقلال الگوریتم 110

3-4-3-2. روش انباشت مدارک وزن‌دار 112

3-4-3-3. شبه کد خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم 113

فصل چهارم

  1. پیاده‌سازی و تحلیل نتایج 116

4-1. مقدمه 116

4-2. مجموعه داده‌ 116

4-3. مدل‌سازی الگوریتم‌ها به زبان استقلال الگوریتم‌ 118

4-4. ابزار تحلیلگر کد استقلال الگوریتم 128

4-5. نتایج آزمایش‌ها 130

فصل پنجم

  1. جمع‌بندی و کار‌های آینده 140

5-1. جمع‌بندی 140

5-2. کار‌های آینده 141

منابع و مآخذ 142

 

 

 

فهرست جداول

فصل سوم

جدول3-1. نگاشت لغات لاتین در خوشه‌بندی ترکیبی به نظریه خرد جمعی …………………………………………………. 93

جدول3-2. یک نمونه از جدول نگاشت استاندارد کد …………………………………………………………………………………. 98

فصل چهارم

جدول4-1. مجموعه داده ………………………………………………………………………………………………………………………. 117

جدول4-2. لیست مجموعه الگوریتم‌های پایه ………………………………………………………………………………………….. 119

جدول4-3. جدول نگاشت استاندارد کد …………………………………………………………………………………………………. 120

جدول4-4. دقت نتایج این الگوریتم‌های خوشه‌بندی را نسبت به کلاس‌های واقعی داده ……………………………….. 130

جدول4-5. جدول مقایسه معیار اطلاعات متقابل نرمال‌ شده (NMI) نتایج آزمایش ………………………………………. 132

 

 

 

 

فهرست تصاویر و نمودار

فصل دوم

شکل 2-1. یک خوشه‌بندی سلسله مراتبی و درخت متناظر …………………………………………………………………………. 10

شکل 2-2. ماتریس مجاورت …………………………………………………………………………………………………………………… 11

شکل 2-3. رابطه دودویی و گراف آستانه ………………………………………………………………………………………………….. 12

شکل 2-4. گراف‌های آستانه برای ماتریس  ………………………………………………………………………………………….. 12

شکل 2-5. الگوریتم خوشه‌بندی سلسله مراتبی تراکمی پیوندی منفرد …………………………………………………………… 13

شکل 2-6. دندوگرام پیوندی منفرد برای ماتریس ………………………………………………………………………………….. 13

شکل 2-7. الگوریتم خوشه‌بندی سلسله مراتبی تراکمی پیوندی کامل ……………………………………………………………. 14

شکل 2-8. دندوگرام پیوندی کامل برای ماتریس  ………………………………………………………………………………….. 14

شکل 2-9. الگوریتم خوشه‌بندی افرازبندی ………………………………………………………………………….. 16

شکل 2-10. الگوریتم فازی خوشه‌بندی  ………………………………………………………………………………………… 18

شکل 2-11. خوشه‌بندی کاهشی ……………………………………………………………………………………………………………… 23

شکل 2-12. شبه‌کد الگوریتم MKF ………………………………………………………………………………………………………… 26

شکل2-13. (الف) مجموعه داده با تعداد 10 خوشه واقعی. (ب) منحنی  ……………………………………………….. 29

شکل2-1۴. (الف) مجموعه داده (ب) منحنی  مربوطه …………………………………………………………………………. 29

شکل2-15. دو افراز اولیه با تعداد سه خوشه …………………………………………………………………………………………….. 31

شکل2-16. نمونه‌های اولیه در نتایج الگوریتم …………………………………………………………………….. 36

شکل 2-17. زیر شبه کد الگوریتم خوشه‌بندی ترکیبی توسط مدل مخلوط …………………………………………………….. 43

شکل 2-18. خوشه‌بندی ترکیبی ………………………………………………………………………………………………………………. 44

شکل 2-19. نمونه ماتریس ، جهت تبدیل خوشه‌بندی به ابر گراف ……………………………………………………….. 45

شکل 2-20. ماتریس شباهت بر اساس خوشه برای مثال شکل (3-5) ………………………………………………………….. 46

شکل 2-21. الگوریتم افرازبندی ابر گراف ………………………………………………………………………………………………… 47

شکل 2-22. الگوریتم فرا خوشه‌بندی  ……………………………………………………………………………………………………… 49

شکل2-23. الگوریتم خوشه‌بندی ترکیبی مبتنی بر ماتریس همبستگی ……………………………………………………………. 50

شکل2-24. الگوریتم افرازبندی با تکرار ……………………………………………………………………………………………………. 53

شکل2-25. نمایش گراف مجاورت در مراحل کاهش درجه ماتریس و شمارش آن ………………………………………… 54

شکل2-26. مثال روند تغییر توزیع تعداد خوشه …………………………………………………………………………………………. 55

شکل2-27. جریان کار عمومی برای پیاده‌سازی الگوریتم افرازبندی گراف …………………………………………………….. 55

شکل 2-28. گراف تابع  در بازه بین صفر و یک ………………………………………………………………………………… 62

شکل 2-29. الگوریتم خوشه‌بندی ترکیبی طیفی مبتنی بر انتخاب بر اساس شباهت ………………………………………… 63

شکل 2-30. مثالی از ماتریس اتصال ………………………………………………………………………………………………………… 66

شکل 2-31. شبه کد خوشه‌بندی ترکیبی انتخابی لی‌مین ……………………………………………………………………………… 68

شکل 2-32. روش ارزیابی خوشه­ی یک افراز­ در روش MAX ……………………………………………………………………. 69

شکل 2-33. چهارچوب خوشه­بندی ترکیبی مبتنی بر انتخاب با استفاده از مجموعه‌ای از خوشه‌های یک افراز …… 71

شکل 2-34. چهارچوب روش بهترین افراز توافقی اعتبارسنجی شده ……………………………………………………………. 72

فصل سوم

شکل3-1. چهارچوب الگوریتم خوشه‌بندی خردمند با استفاده از آستانه‌گیری ………………………………………………… 82

شکل3-۲. محاسبه درجه استقلال دو خوشه‌بندی ……………………………………………………………………………………….. 86

شکل3-3. تأثیر عدم تمرکز بر روی پیچیدگی داده ……………………………………………………………………………………… 89

شکل3-3. تأثیر انتخاب افرازها در خوشه‌بندی ترکیبی مبتنی بر انتخاب بر مقدار NMI ارزیابی‌شده …………………… 91

شکل3-4. شبه کد خوشه‌بندی خردمند با استفاده از آستانه‌گیری …………………………………………………………………… 92

شکل3-5. دسته‌بندی الگوریتم‌های خوشه‌بندی ………………………………………………………………………………………….. 94

شکل3-6. کد الگوریتم K-means به زبان استقلال الگوریتم‌ خوشه‌بندی ……………………………………………………….. 98

شکل3-7. تبدیل کد‌های شروع و پایان به گراف ………………………………………………………………………………………. 100

شکل3-8. تبدیل عملگر شرط ساده به گراف …………………………………………………………………………………………… 100

شکل3-9. تبدیل عملگر شرط کامل به گراف …………………………………………………………………………………………… 101

شکل3-10. تبدیل عملگر شرط تو در تو به گراف ……………………………………………………………………………………. 101

شکل3-11. تبدیل عملگر حلقه ساده به گراف …………………………………………………………………………………………. 102

شکل3-12. تبدیل عملگر حلقه با پرش به گراف ……………………………………………………………………………………… 102

شکل3-13. پیاده‌سازی شرط ساده بدون هیچ کد اضافی ……………………………………………………………………………. 103

شکل3-14. پیاده‌سازی شرط ساده با کدهای قبل و بعد آن ………………………………………………………………………… 103

شکل3-15. پیاده‌سازی شرط کامل …………………………………………………………………………………………………………. 104

شکل3-16. پیاده‌سازی شرط‌ تو در تو …………………………………………………………………………………………………….. 104

شکل3-17. پیاده‌سازی یک شرط کامل در یک شرط ساده ………………………………………………………………………… 105

شکل3-18. پیاده‌سازی یک شرط کامل در یک شرط کامل دیگر ………………………………………………………………… 105

شکل3-19. پیاده‌سازی حلقه ساده ………………………………………………………………………………………………………….. 106

شکل3-20. پیاده‌سازی یک حلقه ساده داخل حلقه‌ای دیگر ……………………………………………………………………….. 106

شکل3-21. پیاده‌سازی یک حلقه داخل یک شرط کامل ……………………………………………………………………………. 106

شکل3-22. پیاده‌سازی یک شرط کامل داخل یک حلقه ساده …………………………………………………………………….. 107

شکل3-23. ماتریس درجه وابستگی‌ کد ………………………………………………………………………………………………….. 108

شکل3-24. شبه کد مقایسه محتوای دو خانه از آرایه‌های استقلال الگوریتم …………………………………………………. 108

شکل3-25. چهارچوب خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم ……………………………………………… 110

شکل3-26. شبه کد خوشه‌بندی خردمند مبتنی بر گراف استقلال الگوریتم …………………………………………………… 113

فصل چهارم

شکل۴-۱. مجموعه داده Halfring ………………………………………………………………………………………………………….. 118

شکل4-2. الگوریتم K-means ……………………………………………………………………………………………………………….. 121

شکل4-3. الگوریتم FCM …………………………………………………………………………………………………………………….. 121

شکل4-4. الگوریتم Median K-Flats …………………………………………………………………………………………………….. 122

شکل4-5. الگوریتم Gaussian Mixture …………………………………………………………………………………………………. 122

شکل4-6. الگوریتم خوشه‌بندی Subtractive …………………………………………………………………………………………… 122

شکل4-7. الگوریتم پیوندی منفرد با استفاده از معیار فاصله اقلیدسی …………………………………………………………… 123

شکل4-8. الگوریتم پیوندی منفرد با استفاده از معیار فاصله Hamming ………………………………………………………. 123

شکل4-9. الگوریتم پیوندی منفرد با استفاده از معیار فاصله Cosine …………………………………………………………… 123

شکل4-10. الگوریتم پیوندی کامل با استفاده از معیار فاصله اقلیدسی …………………………………………………………. 124

شکل4-1۱. الگوریتم پیوندی کامل با استفاده از معیار فاصله Hamming …………………………………………………….. 124

شکل4-1۲. الگوریتم پیوندی کامل با استفاده از معیار فاصله Cosine ………………………………………………………….. 124

شکل4-1۳. الگوریتم پیوندی میانگین با استفاده از معیار فاصله اقلیدسی ……………………………………………………… 124

شکل4-14. الگوریتم پیوندی میانگین با استفاده از معیار فاصله Hamming …………………………………………………. 125

شکل4-15. الگوریتم پیوندی میانگین با استفاده از معیار فاصله Cosine ……………………………………………………… 125

شکل4-16. الگوریتم پیوندی بخشی با استفاده از معیار فاصله اقلیدسی ………………………………………………………. 125

شکل4-17. الگوریتم پیوندی بخشی با استفاده از معیار فاصله Hamming …………………………………………………… 125

شکل4-18. الگوریتم پیوندی بخشی با استفاده از معیار فاصله Cosine ……………………………………………………….. 126

شکل4-19. طیفـی با استفاده از ماتریس شباهت نامتراکم ………………………………………………………………………….. 126

شکل4-20. طیفـی با استفاده از روش نیستروم  با متعادل ساز …………………………………………………………………… 127

شکل4-21. طیفـی با استفاده از روش نیستروم  بدون متعادل ساز ………………………………………………………………. 127

شکل4-22. نرم‌افزار تحلیل‌گر کد استقلال الگوریتم ………………………………………………………………………………….. 128

شکل4-23. ماتریس AIDM ………………………………………………………………………………………………………………….. 129

شکل4-24. میانگین دقت الگوریتم‌های خوشه‌بندی ………………………………………………………………………………….. 131

شکل4-25. رابطه میان آستانه استقلال و زمان اجرای الگوریتم در روش پیشنهادی اول …………………………………. 133

شکل4-26. رابطه میان آستانه پراکندگی و زمان اجرای الگوریتم در روش پیشنهادی اول ………………………………. 133

شکل4-27. رابطه میان آستانه استقلال و دقت نتیجه نهایی در روش پیشنهادی اول ………………………………………. 134

شکل4-28. رابطه میان آستانه پراکندگی و دقت نتیجه نهایی در روش پیشنهادی اول …………………………………….. 134

شکل4-29. رابطه میان آستانه عدم تمرکز و دقت نتیجه نهایی در روش پیشنهادی اول ………………………………….. 135

شکل4-30. رابطه میان آستانه پراکندگی و زمان اجرای الگوریتم در روش پیشنهادی دوم ………………………………. 135

شکل4-31. رابطه میان آستانه پراکندگی و دقت نتایج نهایی در روش پیشنهادی دوم …………………………………….. 136

شکل4-32. رابطه میان آستانه عدم تمرکز و دقت نتایج نهایی در روش پیشنهادی دوم ………………………………….. 137

شکل4-33. مقایسه زمان اجرای الگوریتم‌ ………………………………………………………………………………………………… 138

 

مقدمه

1-1. خوشه‌بندی

به عنوان یکی از شاخه‌های وسیع و پرکاربرد هوش مصنوعی[1]، یادگیری ماشین[2] به تنظیم و اکتشاف شیوه‌ها و الگوریتم‌هایی می‌پردازد که بر اساس آن‌ها رایانه‌ها و سامانه‌های اطلاعاتی توانایی تعلم و یادگیری پیدا می‌کنند. طیف پژوهش‌هایی که در مورد یادگیری ماشینی صورت می‌گیرد گسترده ‌است. در سوی نظر‌ی آن پژوهش‌گران بر آن‌اند که روش‌های یادگیری تازه‌ای به وجود بیاورند و امکان‌پذیری و کیفیت یادگیری را برای روش‌هایشان مطالعه کنند و در سوی دیگر عده‌ای از پژوهش‌گران سعی می‌کنند روش‌های یادگیری ماشینی را بر مسائل تازه‌ای اعمال کنند. البته این طیف گسسته نیست و پژوهش‌های انجام‌شده دارای مؤلفه‌هایی از هر دو رو‌یکرد هستند. امروزه، داده‌کاوی[3] به عنوان یک ابزار قوی برای تولید اطلاعات و دانش از داده‌های خام، در یادگیری ماشین شناخته‌شده و همچنان با سرعت در حال رشد و تکامل است. به طور کلی می‌توان تکنیک‌های داده‌کاوی را به دو دسته بانظارت[4] و بدون نظارت[5] تقسیم کرد [29, 46].

در روش بانظارت ما ورودی (داده یادگیری[6]) و خروجی (کلاس[7] داده) یک مجموعه داده را به الگوریتم هوشمند می‌دهیم تا آن الگوی[8] بین ورودی و خروجی را تشخیص دهد در این روش خروجی کار ما مدلی[9] است که می‌تواند برای ورودی‌های جدید خروجی درست را پیش‌بینی[10] کند. روش‌های طبقه‌بندی[11] و قوانین انجمنی[12] از این جمله تکنیک‌ها می‌باشد. روش‌های با نظارت کاربرد فراوانی دارند اما مشکل عمده این روش‌ها این است که همواره باید داده‌ای برای یادگیری وجود داشته باشد که در آن به ازای ورودی مشخص خروجی درست آن مشخص شده باشد. حال آنکه اگر در زمینه‌ای خاص داده‌ای با این فرمت وجود نداشته باشد این روش‌ها قادر به حل این‌گونه مسائل نخواهند بود [29, 68]. در روش بدون نظارت برخلاف یادگیری بانظارت هدف ارتباط ورودی و خروجی نیست، بلکه تنها دسته‌بندی ورودی‌ها است. این نوع یادگیری بسیار مهم است چون  خیلی از مسائل (همانند دنیای ربات‌ها) پر از ورودی‌هایی است که هیچ برچسبی[13] (کلاس) به آن‌ها اختصاص داده نشده است اما به وضوح جزئی از یک دسته هستند [46, 68]. خوشه‌بندی[14] شاخص‌ترین روش در داده‌کاوی جهت حل مسائل به صورت بدون ناظر است. ایده اصلی خوشه‌بندی  اطلاعات، جدا کردن نمونه‌ها از یکدیگر و قرار دادن آن‌ها در گروه‌های شبیه به هم می‌باشد. به این معنی که نمونه‌های شبیه به هم باید در یک گروه قرار بگیرند و با نمونه‌های گروه‌های دیگر حداکثر متفاوت را دارا باشند [20, 26]. دلایل اصلی برای اهمیت خوشه‌بندی عبارت‌اند از:

اول، جمع‌آوری و برچسب‌گذاری یک مجموعه بزرگ از الگوهای نمونه می‌تواند بسیار پرکاربرد و باارزش باشد.

دوم، می‌توانیم از روش‌های خوشه‌بندی برای پیدا کردن و استخراج ویژگی‌ها[15] و الگوهای جدید استفاده کنیم. این کار می‌تواند کمک به سزایی در کشف دانش ضمنی[16] داده‌ها انجام دهد.

سوم، با خوشه‌بندی می‌توانیم یک دید و بینشی از طبیعت و ساختار داده به دست آوریم که این می‌تواند برای ما باارزش باشد.

چهارم، خوشه‌بندی می‌تواند منجر به کشف زیر رده‌های[17] مجزا یا شباهت‌های بین الگوها ممکن شود که به طور چشمگیری در روش طراحی طبقه‌بندی قابل استفاده باشد.

تعداد صفحه : 194

قیمت : 14000تومان

بلافاصله پس از پرداخت ، لینک دانلود پایان نامه به شما نشان داده می شود

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت :        09199970560        info@arshadha.ir

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

شماره کارت :  6037997263131360 بانک ملی به نام محمد علی رودسرابی

11

مطالب مشابه را هم ببینید

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید