پایان نامه ارشد هوش مصنوعی: استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

دانلود متن کامل پایان نامه مقطع کارشناسی ارشد رشته مهندسی کامپیوتر

گرایش هوش مصنوعی

با عنوان : استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

دانشگاه شیراز

دانشکده مهندسی برق و کامپیوتر

پایان نامه­ کارشناسی ارشد در رشته­ مهندسی کامپیوتر- هوش مصنوعی

عنوان:

استنتاج شبکه های تنظیمات ژنی از روی داده های سری زمانی Microarray به وسیله شبکه های بیزین دینامیک

استاد راهنما:

دکتر منصور ذوالقدری جهرمی

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شودتکه هایی از متن پایان نامه به عنوان نمونه :(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)چکیده:شبکه های تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن هستند که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کنند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد.روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده است. در این میان، شبکه های بیزین دینامیک مزایای ویژه ای دارا می باشند که باعث شده تا توجه زیادی را به خود جلب کنند.با وجود تحقیقات انجام شده در این زمینه، مهندسی معکوس شبکه های تنظیم کننده ژن به وسیله شبکه های بیزین دینامیک به هیچ عنوان امری بدیهی نیست. غالباً تعداد نمونه های موجود برای آموزش مدل از تعداد مجهولات مسئله بسیار کمتر است. همچنین میزان پیچیدگی زیاد این مدل ها و دقت آنها از مهم ترین نواقص آن ها می باشند.یکی از عمده ترین روش هایی که برای بالا بردن دقت شبکه های استنتاج شده به کار گرفته می شود استفاده از دانش اولیه در مورد شبکه های تنظیم کننده ژنی است. یکی از منابع عمده این دانش اولیه اطلاعات ما در مورد ساختار کلی شبکه های تنظیم کننده ژنی است. تحقیقات انجام شده نشان می دهند که تعداد یال های موجود در این شبکه ها کم است. همچنین شواهد بسیاری بدست آمده اند که نشان می دهند توزیع درجه خروجی در شبکه های تنظیم ژنی از قانون توانی پیروی می کنند. در واقع این شبکه ها در درجه خروجی scale-free هستند.علیرغم این شواهد، روش های یادگیری شبکه های بیزین دینامیک این گونه شبکه ها را شبکه هایی با ساختار تصادفی در نظر می گیرند و یا تنها پیچیدگی شبکه را کنترل می کنند.در این تحقیق روشی برای یاد گیری شبکه های بیزین دینامیک ارائه می شود که به طور مشخص بر این فرض شکل گرفته که شبکه واقعی ساختاری scale-free در توزیع درجه خروجی دارد. روش ارائه شده پیچیدگی زمانی چند جمله ای دارد و می تواند برای استنتاج شبکه هایی با تعداد گره های زیاد مورد استفاده قرار گیرد.آزمایش هایی که برای مقایسه توانایی الگوریتم ارائه شده با متدهای قبلی یادگیری شبکه انجام شده اند نشان می دهند که الگوریتم ارائه شده، زمانی که برای استنتاج شبکه هایی استفاده می شود که scale-free هستند، قادر است کیفیت شبکه استنتاج شده را به خصوص زمانی که داده های آموزشی ناکافی هستند به صورت قابل توجهی افزایش دهد. فصل اول1- مقدمهدر هر سلول یک ارگانیزم زنده، هر لحظه، هزاران ژن با هم در ارتباط هستند تا فرآیندهای پیچیده زیستی را انجام پذیر سازند. شبکه های تنظیم کننده ژنتیکی[1] مجموعه ای از قسمت های DNA در سلول می باشد که به طور غیر مستقیم (به وسیله RNA یا پروتئین های تولیدی) با یکدیگر و مواد دیگر درون سلول ارتباط دارند و بدین طریق سرعت رونویسی[2] از روی ژن ها را برای تشکیل mRNA کنترل می کنند. هر مولکول mRNA یک پروتئین خاص با کارایی خاصی را تولید می کند. بعضی از پروتئین ها فقط برای فعال یا غیر فعال کردن ژن ها استفاده می شوند. این گونه پروتئین ها فاکتورهای رونویسی[3] نامیده می شوند و اصلی ترین نقش را در شبکه تنظیم ژنی ایفا می کنند. به بیان دیگر شبکه تنظیم کننده ژنتیکی مجموعه ای از ارتباطات ژن-ژن است که رابطه علت و معلولی را در فعالیت های ژنی ایجاد می کند. دانش ما در مورد این شبکه ها نقش بسیار موثری در شناخت فرآیندهای زیستی ایفا می کند و می تواند باعث کشف روش های جدید برای درمان بیماری های پیچیده و تولید داروهای اثر گذار گردد. از این رو تشخیص و مهندسی معکوس شبکه های تنظیم کننده ژنتیکی به یکی از مهم ترین زمینه های تحقیقاتی تبدیل شده است [1].عموماً برای تشکیل شبکه های تنظیم کننده ژنتیکی از داده های Microarray استفاده می کنند. Microarray یک تکنولوژی است که قابلیت اندازه گیری هم زمان میزان بیان[4] mRNA مربوط به هزاران ژن را بوجود آورده است و می تواند اطلاعات مربوط به ارتباط ژن ها را در سطح ژنوم در اختیار ما قرار دهد [2]. اما راه حل ساده ای برای تشخیص شبکه های تنظیم کننده ژنتیکی از روی داده های Microarray وجود ندارد. در بیشتر موارد تعداد مجهولات مسئله بسیار زیاد است. این در حالی است که تعداد کمی داده در اختیار داریم. همچنین در بسیاری از موارد میزان خطا در اندازه گیری های موجود بالاست و یا با مشکل عدم وجود اندازه گیری برای بعضی از متغیرها مواجه هستیم.داده های Microarray را می توان به دو نوع ایستا[5] و سری زمانی[6] تقسیم نمود. حالت اول تصویری است از بیان ژن ها در یک لحظه و شرایطی خاص. در حالت دوم بیان ژن ها در یک فرآیند درون سلولی در طول زمان اندازه گیری می شود. این سری های زمانی منعکس کننده فرآیندهای دینامیک درون سلولی هستند. اکثر روش های اولیه ای که برای آنالیز داده های سری زمانی Microarray استفاده می شدند در واقع روش هایی بودند که برای داده های ایستا طراحی شده بودند. در چند سال اخیر روش هایی برای کار با داده های سری زمانی به طور خاص مطرح شده اند که قادرند علاوه بر حل مشکلاتی که مخصوص داده های سری زمانی هستند، از ویژگی های منحصر به فرد این گونه داده ها نیز استفاده کنند. با این حال کار کردن با داده های سری زمانی نیازمند ظرافت و دقت بیشتری نسبت به داده های ایستا است و عمل مهندسی معکوس شبکه های تنظیم کننده ژنتیکی در این موارد مشکل تر است.روش های زیادی برای تشخیص شبکه های تنظیم کننده ژنتیکی پیشنهاد شده اند که مهمترین آن ها عبارتند از: شبکه های بولین [3]، شبکه های بولین تصادفی [4]، معادلات دیفرانسیل [5] و شبکه های بیزین[7] [6]. در این میان، شبکه های بیزین که قادرند رابطه علت و معلولی بین متغیر ها را بر اساس روابط احتمالاتی بیان کنند توجه زیادی را به خود معطوف کرده اند. به علت نویزی بودن داده های Microarray، استفاده از مدل های احتمالاتی به میزان زیادی می تواند کارایی مدل را افزایش دهد. علیرغم موفقیت نسبی شبکه های بیزین، عدم امکان وجود حلقه[8] در این شبکه ها کارایی آنها را در بسیاری از موارد محدود می کند چون در شبکه های تنظیم کننده ژنتیکی واقعی حلقه های بازخورد[9] متداول هستند. از این رو زمانی که با داده های سری زمانی مواجه هستیم شبکه های بیزین دینامیک به گزینه ای مناسب برای مدل کردن تبدیل می شود [7،8،9]. شبکه های بیزین دینامیک فرم عمومی تری از شبکه های بیزین هستند که می توانند داده های با تاخیرهای زمانی را مدل کنند.شبکه های بیزین دینامیک مزایای ویژه ای دارا می باشند که باعث شده تا این مدل توجه زیادی را به خود جلب کند. اول اینکه در این نوع مدل قادر هستیم تا روابط علت و معلولی بین متغیر ها را مستقیماً نشان داده و از اطلاعات موجود در این مورد استفاده کنیم. دومین امتیاز این مدل ماهیت تصادفی آن است. فرآیند های مربوط به تنظیمات ژنی فرآیند های تصادفی هستند و حتی اگر خود این فرآیندها ذاتاً قطعی باشند، میزان زیاد خطا در اندازه گیری های انجام شده باعث می شوند تا فرآیند ها از دید ما تصادفی باشند. سومین موردی که باعث برتری این مدل می شود قابلیت این شبکه ها برای دنبال کردن تغییر متغیرها در طول زمان است.علیرغم این ویژگی ها مهندسی معکوس شبکه های تنظیم ژن از روی داده های سری زمانی به وسیله شبکه های بیزین دینامیک به هیچ عنوان امری بدیهی نیست. غالباً تعداد نمونه های موجود برای آموزش مدل از تعداد مجهولات مسئله بسیار کمتر است [10]. همچنین در مقادیر اندازه گیری شده خطای زیادی وجود دارد و در مواردی برای بعضی از متغیرها اندازه گیری صورت نگرفته است. در حال حاضر در اکثر موارد در آزمایش هایی با تعداد کمی ژن یا داده های شبیه سازی شده به کار گرفته شده اند. میزان پیچیدگی زیاد این مدل ها و همچنین کمی دقت آنها از مهم ترین نواقص آن ها می باشند. برای بدست آوردن مدل هایی برای کار با داده های حجم بالا و افزایش کارایی مدل های تولید شده به تحقیقات بیشتری در این زمینه نیاز است.یکی از عمده ترین روش هایی که برای بالا بردن دقت شبکه های استنتاج شده و جبران کمبود داده های آموزشی طی فرآیند یادگیری شبکه به کار گرفته می شود استفاده از دانش اولیه در مورد شبکه های تنظیم کننده ژنی است [11]. یکی از منابع عمده این دانش اولیه اطلاعاتی است که در مورد ساختار کلی شبکه های تنظیم کننده ژن بدست آمده است. تحقیقات انجام شده نشان می دهند که این شبکه ها از نظر ارتباطی خلوت[10] هستند. به بیان دیگر تعداد یال های موجود در این شبکه ها کم است. همچنین شواهد بسیاری بدست آمده اند که نشان می دهند توزیع درجه خروجی در شبکه های تنظیم ژنی از قانون توانی[11] پیروی می کنند [12،13]. در واقع این شبکه ها در درجه خروجی scale-free هستند. این در حالی است که درجه ورودی در آن ها از توزیع پواسن با میانگین کم پیروی می کند [14،15،16].به زبان زیستی، در شبکه های تنظیم کننده ژنی بیان هر ژن توسط تعداد کمی ژن دیگر تنظیم می شود و همچنین اکثر ژن ها بر روی تعداد کمی ژن دیگر اثر تنظیم کنندگی دارند. اما، تعداد محدودی از ژن ها وجود دارند که بر روی بیان تعداد زیادی از ژن های دیگر اثر دارند. این ژن ها که عمده ترین نقش را در شبکه های تنظیم کننده ژنی بر عهده دارند hub نامیده می شوند.با وجود اینکه شواهد بسیاری در تایید ساختار scale-free شبکه های تنظیم کننده ژنی بدست آمده است، تمامی روش های یادگیری شبکه های بیزین دینامیک این گونه شبکه ها را شبکه هایی با ساختار تصادفی در نظر می گیرند و یا تنها پیچیدگی شبکه را کنترل می کنند.در این تحقیق روشی برای یاد گیری شبکه های بیزین دینامیک ارائه می شود که به طور مشخص بر این فرض شکل گرفته که شبکه واقعی ساختاری scale-free در توزیع درجه خروجی دارد. روش ارائه شده پیچیدگی زمانی چند جمله ای دارد و می تواند برای یادگیری شبکه هایی با تعداد گره های زیاد مورد استفاده قرار گیرد.برای مقایسه توانایی الگوریتم ارائه شده با متدهای قبلی یادگیری شبکه از آزمایش های شبیه سازی متعددی استفاده شده است. نتایج این آزمایش ها نشان می دهند که الگوریتم ارائه شده، زمانی که برای یادگیری شبکه هایی استفاده می شود که scale-free هستند، قادر است کیفیت شبکه استنتاج شده را به صورت قابل توجهی افزایش دهد. هر چه اندازه داده های آموزشی کمتر باشد، تفاوت کیفیت شبکه استنتاج شده به وسیله الگوریتم ارائه شده با شبکه های استنتاج شده به وسیله الگوریتم های قبلی بیشتر می شود. همچنین زمانی که از این الگوریتم برای یاد گیری شبکه های با ساختار تصادفی استفاده می شود، الگوریتم ارائه شده قادر است تا شبکه هایی را بازیابی کند که از لحاظ مطابقت با شبکه واقعی معادل شبکه های استنتاج شده به وسیله روش های قبلی است.1-1- ضرورت انجـام طرح شبکه های تنظیم کننده ژنتیکی نقش مهم و عمده ای را در تمام فرآیندهای حیاتی از جمله تفکیک سلولی، متابولیسم، چرخه سلولی و هدایت سیگنال ایفا می کنند. با فهمیدن دینامیک این گونه شبکه ها، قادر خواهیم بود تا به میزان زیادی مکانیزم بیماری هایی را که از به هم خوردن نظم این فرآیندهای سلولی بوجود می آیند دریابیم. همچنین پیش بینی دقیق رفتار شبکه های تنظیم کننده ژنتیکی سرعت انجام پروژه های بیوتکنولوژیکی را افزایش می بخشد. چون این گونه پیش بینی ها قطعاً از آزمایش های واقعی در محیط آزمایشگاه سریع تر و ارزان تر هستند.2-1- نگاه کلی به فصل های رسالهدر فصل دوم از این رساله، ابتدا تعریف دقیق تری از شبکه های تنظیم کننده ژنی و نقش آن ها در فرآیندهای سلولی ارائه می شود. سپس، روش های موجود برای استنتاج شبکه های تنظیمات ژنی معرفی خواهند شد و ویژگی های هر یک بررسی می شوند.در فصل سوم، تئوری های مربوط به شبکه های بیزین دینامیک و گراف های scale-free مرور می شوند. در ادامه این بخش، الگوریتم پیشنهادی برای یادگیری شبکه های بیزین دینامیک با ساختار scale-free ارائه می گردد.در فصل چهارم، آزمایش های انجام شده و نتایج بدست آمده از آن ها گزارش داده می شوند. در این بخش، توانایی الگوریتم پیشنهادی برای استنتاج کردن شبکه هایی با ساختار scale-free و یا با ساختار تصادفی با الگوریتم های موجود برای یادگیری شبکه مقایسه می شود.در پایان، خلاصه ای از دست آوردهایی تحقیق ارائه می گردد.[1] Gene regulatory networks[2] Transcription[3] Transcription factor[4] Expression level[5] Static[6] Time-Series[7] Bayesian networks[8] Cycle[9] Feedback loops[10] Sparse connectivity[11] Power-lawتعداد صفحه : 92قیمت : چهارده هزار تومان

بلافاصله پس از پرداخت ، لینک دانلود پایان نامه به شما نشان داده می شود

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت :        09124404335        info@arshadha.ir

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

--  -- --

مطالب مشابه را هم ببینید

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید