هدایت فازی ربات¬های خود¬مختار با استفاده از یادگیری تشدیدی و بهینه¬سازی کلونی زنبور مصنوعی

موضوع:

هدایت فازی ربات­های خود­مختار با استفاده از یادگیری تشدیدی و بهینه­سازی کلونی زنبور مصنوعی

استاد راهنما:

دکتر رضا قادری

استاد مشاور:

دکترعطااله ابراهیم­زاده

تکه هایی از متن به عنوان نمونه :

چکیدهربات خود­مختار به سامانه­ی فیزیکی‌ای اطلاق می­شود که بتواند به طور هدفمند، بدون دانش پیشین از محیط و بدون دخالت انسان در دنیای واقعی، که مخصوصا برای ربات مهندسی نشده، حرکت کند و وظایف مشخصی را انجام دهد. به عنوان مثال، مطلوب مساله ناوبری ربات، که در این پژوهش مطرح است، حرکت ربات به سمت هدفی مشخص بدون برخورد با موانع موجود می­باشد. در تعریفی ساده می­توان سامانه­ی ربات را متشکل از حسگرها، واحد تصمیم­گیری و محرک­ها دانست. واحد تصمیم­گیری پس از درک و تفسیر اطلاعات دریافتی از حسگرها، تصمیم مناسب را اتخاذ و فرامین حرکتی متناسب را برای ارسال به محرک­ها تولید می­نماید. در این پایان نامه ، الگوریتم تصمیم­گیری­ برای ناوبری ربات پیشنهاد می­شود که از مزایای ترکیب منطق فازی و یادگیری Q برای مواجه و حل چالش­های ناوبری خودمختار بهره می­گیرد. منطق فازی با تکیه بر خصوصیات موثر خود از قبیل عدم نیاز به مدل دقیق محیط، پایداری نسبت به داده­های غیر قطعی و نویزی، پاسخ سریع و پیاده سازی آسان، ابزاری کار­آمد برای حل مساله­ی ناوبری ربات خودمختار به شمار می­رود. یادگیری Q داری ساختار بدون مربی، پویا، ساده و قابل پیاده­سازی آسان می­باشد. از این رو ابزاری کارآمد جهت تنظیم برخط سامانه استنباط فازی است. ربات اطلاعات به دست آمده از جهان پیرامون را به مجموعه­ای از حالت­های فازی خلاصه می­کند. برای هر حالت فازی تعدادی عمل پیشنهادی وجود دارند. حالت­ها توسط قوانین اگر-آنگاه فازی، که با منطق انسان طرح شده­اند، به عمل­های نظیرشان مربوط می­شوند. برای هر حالت، ربات توسط یادگیری Q بهترین عمل، که دارای بیشترین مقدار q است، را از طریق تعاملات برخط با محیط انتخاب می­کند. پارامترهای کلیدی مجموعه فازی و یادگیری Q، شامل پارامترهای توابع عضویت ورودی فازی و همچنین مقدار عامل فراموشی یادگیری Q، توسط بهینه­سازی کلونی زنبور مصنوعی به صورت غیربرخط، پیش از قرار گرفتن ربات در محیط­های آزمایش، به دست آمده­اند. هدف، طراحی الگوریتم ناوبری انعطاف­پذیری است که بتواند خود را به طور کارآمد با محیط­های کاملا ناشناخته، دارای تعداد مختلفی از موانع با شکل­های متنوع، تطبیق دهد. موانع به شکل­های مربعی، دایروی، مقعر، محدب، چندضلعی و شکل­های نا‌‌منظم و تعریف نشده‌ی هندسی می­باشند. یادگیری Q بدون مرحله اکتشافی (یادگیری قبل از آزمایش) به کار گرفته شده­است. بدین معنی که مقادیر q در هر آزمایش بدون پیش­فرض و از مقدار اولیه صفر شروع می­شوند، لذا محیط یادگیری جهت مقداردهی اولیه به مقادیر q وجود ندارد. الگوریتم ناوبری پیشنهاد شده بر روی ربات کپرا و در محیط شبیه­سازی KiKS آزمایش شد. معیارهای ارزیابی، موفقیت ربات در رسیدن به هدف، سرعت و امنیت مسیر طی شده می­باشند. نتایج شبیه­سازی نشان دادند که الگوریتم تصمیم گیری ارایه شده قادر است در اکثر مواقع ربات را با موفقیت به سمت هدف در مسیرهای امن و سریع هدایت نماید.کلمات کلیدی: یادگیری Q فازی- ناوبری خودمختار- ربات کپرافهرست مطالب1-مقدمه............................................................................... 21-1- تعاریف اولیه در رباتیک......................................................... 31-2- چالش های ناوبری خودمختار..................................................... 31-3- روش های حل مساله ی ناوبری ربات....................................... 41-4- اهداف و نتایج............................................................................. 61-5- ساختار پایان نامه.................................................................... 92- بررسی روشهای پیشین................................................................... 112-1- مقدمه........................................................................................... 112-2- معماری سلسله مراتبی............................................................. 112-2-1-روش گراف دیداری................................................................. 122-2-2-روش تجزیه سلولی............................................... 132-2-3-روش میدان پتانسیل.......................................... 132-3- معماری مبتنی بر رفتار......................................................... 142-4- روش ترکیبی................................................................................. 172-5- مطالعات مرتبط........................................................................... 182-6- نتیجه گیری................................................................................. 213- منطق فازی، یادگیری Q و بهینه سازی کلونی زنبور مصنوعی. 243-1- مقدمه         ............................................................................................................................................ 243-2- منطق فازی................................................................................. 243-3- یادگیری Q................................................................................. 273-4- بهینه سازی کلونی زنبور مصنوعی....................................... 283-4-1-زنبور ها در طبیعت ....................................... 293-4-2-الگوریتم بهینه سازی کلونی زنبورهای مصنوعی.......... 303-4-3-فاز جمعیت اولیه............................................ 323-4-4-انتخاب جمعیت اولیه....................................... 323-4-5-فاز رنبورهای به کار گرفته شده......... 323-4-6-فاز زنبورهای تماشاگر................................ 323-4-7-فاز زنبورهای دیده بان............................. 334- الگوریتم یادگیری Q فازی پیشنهادی............................... 354-1- مقدمه.......................................................................................... 354-2- ربات کپرا................................................................................... 354-3- یادگیری Q فازی........................................................................ 384-4- بهینه سازی................................................................................. 435- نتایج شبیه سازی ها و پیشنهادهای ادامه کار....... 485-1- مقدمه........................................................................................... 485-2- نرم افزار شبیه سازی KiKS.................................................. 485-3- محیط های شبیه سازی................................................................ 515-4- نتایج شبیه سازی...................................................................... 535-4-1-موفقیت در رسیدن به هدف (GR).................. 535-4-2-امنیت مسیر طی شده تا هدف (SF)............ 535-4-3-سرعت مسیر طی شده تا هدف (SP)............... 535-5- بحث و نتیجه گیری.................................................................... 655-6-پیشنهادهای ادامه کار............................................................. 66مراجع....................................................................................................................................................................................................67چکیده لاتین...........................................................................................................................................................................................70 فهرست شکل هاشکل(‏2‑1): معماری سلسله مراتبی جهت ناوبری ربات.......... 12شکل(‏2‑2): معماری مبتنی بر رفتار جهت ناوبری ربات........ 15شکل(‏2‑3): معماری رده بندی جهت ناوبری ربات............... 15شکل(‏2‑4): معماری الگوهای حرکتی جهت ناوبری ربات......... 16شکل(‏2‑5): معماری ترکیبی جهت ناوبری ربات................. 18شکل(‏3‑1): توابع عضویت فازی متغیرهای ورودی.............. 25شکل(‏3‑2): روش فازی زدایی متوسط مقدار بیشینه............ 26شکل(4-1): ربات کپرا.................................... 35شکل(4‑2): میزان دریافت نور بازتاب شده از موانع مختلف توسط گیرنده­های مادون­قرمز ربات کپرا.......................... 36شکل(4-3): توابع عضویت فازی ورودی ...................... 38شکل(4-4): نمایش راستای محاسبه زاویه چرخش در دستگاه کارتزین 39شکل(4-5): الگوریتم یادگیری Q فازی...................... 40شکل(4-6): فلوچارت الگوریتم یادگیری Q فازی پیشنهادی..... 41

شکل(4-7): بهینه سازی غیربرخط پارامترهای کلیدی یادگیری Q و سامانه استنباط فازی.....................................43

شکل(4-8): محیط در نظر گرفته شده جهت فرآیند بهینه سازی.. 44شکل(4-9): نمودار بهینه سازی تابع هدف بر حسب تعداد تکرارها 45شکل(4-10): فلوچارت الگوریتم بهینه سازی................. 46شکل(5-1): پنجره آماده سازی KiKS........................ 49شکل(5-2): نمونه شکل های موانع......................... 52شکل(5-3): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 56شکل(5-4): عملکرد الگوریتم فازی در محیط ساده............ 56شکل(5-5): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 57شکل(5-6): عملکرد الگوریتم فازی در محیط ساده............ 57شکل(5-7): عملکرد الگوریتم یادگیری Q فازی در محیط ساده.. 58شکل(5-8): عملکرد الگوریتم فازی در محیط ساده............ 58شکل(5-9): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی 59شکل(5-10): عملکرد الگوریتم فازی در محیط معمولی......... 59شکل(5-11): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی 59شکل(5-12): عملکرد الگوریتم فازی در محیط معمولی......... 59شکل(5-13): عملکرد الگوریتم یادگیری Q فازی در محیط معمولی 60شکل(5-14): عملکرد الگوریتم فازی در محیط معمولی......... 61شکل(5-15): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده 62شکل(5-16): عملکرد الگوریتم فازی در محیط پیچیده......... 62شکل(5-17): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده 63شکل(5-18): عملکرد الگوریتم فازی در محیط پیچیده......... 63شکل(5-19): عملکرد الگوریتم یادگیری Q فازی در محیط پیچیده 64شکل(5-20): عملکرد الگوریتم فازی در محیط پیچیده......... 64 فهرست جدول هاجدول(‏2‑1): مقایسه خصوصیات معماری های مختلف.............. 22جدول(‏2‑2): تعریف معیارهای ارزیابی معماری های مختلف...... 22جدول(4‑1): محدوده صفات زبانی زاویه چرخش................. 39جدول(4‑2): مقادیر سیگنال تشدیدی در حالتهای مختلف........ 42جدول(4-3): پارامترهای الگوریتم بهینه سازی.............. 44جدول(4-4): مقادیر پارامترهای بهینه شده و تابع هدف...... 45جدول(5‑1): توصیف کمی درجه پیچیدگی محیط ها............... 53جدول(5-2): عملکرد الگوریتم یادگیری Q فازی پیشنهادی..... 54جدول(5-3): عملکرد الگوریتم فازی........................ 55 فهرست علایم و اختصاراتFQL................................................................................................................. Fuzzy Q-learningDFQL............................................................................................... Dynamic Fuzzy Q-learningABC.................................................................................... Artificial Bee Colony OptimizationKiKS............................................................................................. KiKS is a Khepera Simulatorمقدمه 

1-          مقدمه

ربات خود­مختار[1] به سامانه­ی فیزیکی‌ای اطلاق می­شود که بتواند به طور هدفمند، بدون دانش پیشین از محیط و بدون دخالت انسان در دنیای واقعی، که مخصوصا برای ربات مهندسی نشده، حرکت کند و وظایف مشخصی را انجام دهد [1]. به عنوان مثال، مطلوب مساله ناوبری[2] ربات، که در این پژوهش مطرح است، حرکت ربات به سمت هدفی مشخص بدون برخورد با موانع موجود می­باشد. این موانع می­توانند موانع ثابت مثل دیوار، میز، صندلی و یا موانع متحرک مثل انسانها و ... باشند. جهت عملکرد بهتر لازم است ربات محیط را حس نماید و قادر به برنامه ریزی عملیات خود باشد. پیچیدگی و تنوع محیط­هایی که ربات باید در آنها کار کند، همچنین محدودیتهای زیاد حرکتی (مانند حداکثر سرعت ممکن ربات) و محیطی (مانند وجود موانع) که ربات مجبور به رعایت آنها می­باشد، مساله ناوبری ربات را به یک مساله مشکل تبدیل کرده است. ربات­های خودمختار بایستی قادر به سازگاری با عدم قطعیت­های بسیار موجود در محیط باشند، زیرا محیط­های فیزیکی معمولاً پویا و غیر قابل پیش­بینی هستند. اغلب موانع ایستا نیستند و داده های حسگرها به علت نویز، غیردقیق و غیر قابل اطمینان هستند. حرکت ربات­ها، معمولاً براساس معیارهای کارایی عملکرد و محدودیت­های ذاتی آنها بهینه می­شود. معیارهای کارایی­ متداول، غالباً کمینه­سازی تعداد برخورد با موانع و زمان رسیدن به هدف می­باشند و از آن سو محدودیت­، لحاظ نمودن حداکثر سرعت ربات است.ماشین­های هوشمندی که بتوانند وظایف خسته کننده، تکراری و خطرناک را انجام دهند، جایگزین تواناتر و قدرتمندتر و قابل اطمینان تری نسبت به نیروهای انسانی می­باشند. رباتیک امروزی از زمین‌های ساخت یافته­ی کارخانه­ها به محیط­های انسانی غیرقابل پیش­بینی حرکت کرده است. ربات­های امروزی می­بایست در محیط­های ساخت­نیافته و پویا فعالیت کنند. ربات­ها به طور گسترده در منازل، اداره­ها، بیمارستان­ها، امدادرسانی در نواحی خطرناک یا غیرقابل دسترس، یاری­رسانی به افراد معلول، تولید و مونتاژ و بسته­بندی، حمل و نقل، اکتشافات زمینی و فضایی، جنگ افزارها و تحقیقات آزمایشگاهی به کار می­روند. 1 autonomous[2]  navigation ***ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است***

متن کامل را می توانید دانلود نمائید

چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)

ولی در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود است

تعداد صفحه :86قیمت : چهارده هزار تومان  

بلافاصله پس از پرداخت ، لینک دانلود به شما نشان داده می شود

و به ایمیل شما ارسال می شود.

پشتیبانی سایت :        09124404335        info@arshadha.ir

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

--  -- --

مطالب مشابه را هم ببینید

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید

2 پاسخ

بخش دیدگاه ها غیر فعال است.