پایان نامه کارشناسی ارشد مهندسی برق گرایش الکترونیک

دانلود متن کامل کارشناسی ارشد مهندسی برق گرایش الکترونیک

برای رعایت حریم خصوصی نام نگارنده درج نمی شود

پایان نامه دوره کارشناسی ارشد در رشته برق- الکترونیک

موضوع:

غنی سازی سیگنال گفتار مبتنی بر روش تفریق طیفی و تجزیه مقادیر منفرد

استاد راهنما:

دکتر محمدرضا کرمی

اساتید مشاور:

دکتر رضا قادری

دکتر حسین میارنعیمی

تکه هایی از متن به عنوان نمونه :

چکیده
در این پایان‌نامه ابتدا به بررسی خلاصه ای از چگونگی تولید گفتار در انسان پرداخته و سپس به بررسی اجمالی روش های عمده بهسازی گفتار و مسائل و مباحث موجود در این روش ها پرداخته شده است. در بررسی این روش ها سعی شده است تا ضمن بیان اصول و مبانی هر روش، نقاط ضعف و قوت آنها را ذکر شود. سپس در فصل دوم، روش مشهور تفریق طیفی معرفی و بررسی شده است. در این فصل همچنین به روش های بهینه شده تفریق طیفی مثل تفریق طیفی تعمیم یافته، اصلاح مقادیر منفی، تفریق طیفی چند بانده و … پرداخته شده است. در روش های مبتنی بر تفریق طیفی، روش پایه تفریق طیفی، تفریق طیفی تعمیم یافته، تفریق طیفی چند باند، پیاده­سازی و تحلیل و ارزیابی شدند. از مشکلات عمده در روش های مبتنی بر تفریق طیفی تولید نویز موزیکال می باشد که تلاش شد تا میزان تولید نویز موزیکال در روش بهبودیافته تفریق طیفی چند باند، کاهش یابد.
در فصل سوم به معرفی تجزیه مقادیر منفرد پرداخته می شود و توضیح کاملی در زمینه ریاضیات تجزیه مقادیر منفرد و خواص و قضایای مربوط به این تجزیه آورده شده است. همچنین روش های بدست آوردن مقادیر منفرد و بردارهای ویژه در این فصل توضیح داده شده است. سپس مروری بر کاربردهای این تجزیه به خصوص در پردازش سیگنال آورده شده است. در انتهای فصل نیز روش های تشخیص نواحی سکوت یا الگوریتم های VAD بیان شده است.
در فصل چهارم، روش های پیشنهادی بهسازی گفتار بر اساس روش تفریق طیفی و تجزیه مقادیر منفرد ارایه شده اند. در این فصل ابتدا طریقه محاسبه نویز تخمینی با استفاده از تجزیه مقادیر منفرد توضیح داده شده است و سپس روش بهینه کردن نویز تخمینی با استفاده از الگوریتم های VAD و آشکار ساز حروف بی صدا و صدا دار بیان شده است. در تمامی روش های پیشنهادی حذف نویز مبتنی بر تفریق طیفی از تجزیه مقادیر منفرد به منظور تخمین نویز استفاده شده است. در روش های پیشنهادی سعی بر آن بوده است که حالت بهینه را با تغییر پارامتر ها بدست آوریم. در فصل پنجم نتایج حاصله از شبیه سازی روش های پیشنهادی آورده شده و با کارهای قبلی مقایسه و ارزیابی می شوند. در پایان، در فصل ششم به جمع بندی مطالب و موضوعات مورد بحث پرداخته شده است.

واژه های کلیدی:
غنی سازی سیگنال گفتار، تفریق طیفی، تجزیه مقادیر منفرد، آشکار ساز گفتار ، تبدیل موجک، طیف نگاره (اسپکتروگرام)، تست شنوائی.

فهرست مطالب

عنوان    صفحه
مقدمه    1
فصل اول- مروری بر روش های عمده بهسازی گفتار
1-1-    مبانی تولید سیگنال گفتار……………………………………………………………………………..    3
1-2-    مفاهیم بهسازی گفتار…………………………………………………………………………………..    7
1-3-    کاربردهای عمده بهسازی گفتار…………………………………………………………………….    8
1-4-    طبقه بندی روش های بهسازی گفتار……………………………………………………………..    9
1-4-1-   کاهش نویز با استفاده از خاصیت تناوبی گفتار……………………………………………..    11
1-4-2-   بهسازی گفتار بر اساس مدل………………………… ………………………………………….    12
1-4-3-   تکنیک های مبتنی بر دامنه طیفی زمان-کوتاه……………………………………………….    13
1-4-4-   روش های مبتنی بر آستانه گذاری روی ضرایب موجک……………………………….    15
1-4-5-   حذف وفقی نویز……………………………………………………………………………………..    16

فصل دوم- مروری بر روش های تفریق طیفی
2-1-    تفریق طیفی……………………………………………………………………………………………….    19
تعمیم روش های تفریق طیفی………………………………………………………………………    21
مقادیر طیفی منفی……………………………………………………………………………………….    23
اطلاحات روی تفریق طیفی………………………………………………………………………….    24
2-4-1-    متوسط گیری اندازه…………………………………………………………………………………    24
2-4-2-    تعمیم تفریق طیفی…………………………………………………………………………………..    25
2-4-3-    تفریق طیفی با استفاده از کف طیفی و تفریق بیش از حد……………………………..    25
2-4-4-    تفریق طیفی با تخمین گر MMSE STSA………………………………………………….    27
2-4-5-    تفریق طیفی بر مبنای ویژگی های ادراکی…………………………………………………..    28
2-4-6-    روش های تفریق طیفی وابسته به فرکانس………………………………………………….    29
2-4-7-    تفریق طیفی چند باند………………………………………………………………………………    30
2-4-7-1-    پیش پردازش……………………………………………………………………………………..    32
2-4-7-2-    شرح تفریق طیفی چند باند…………………………………………………………………..    34

فصل سوم- آشنائی با تجزیه مقادیر منفرد و الگوریتم های VAD
3-1-    تجزیه مقادیر منفرد……………………………………………………………………………………..    38
رابطه بین تجزیه مقادیر منفرد و تجزیه مقادیر ویژه………………………………………….    39
مقادیر ویژه و بردارهای ویژه………………………………………………………………………..    40
3-3-1-    روش یافتن مقادیر ویژه……………………………………………. ……………………………    40
3-3-2-    مقادیر ویژه مختلط………………………………………………………………………………….    42
3-3-3-    مقادیر ویژه ماتریس های مثلثی و قطری…………………………………………………….    43
3-3-4-    مقادیر ویژه ماتریس های هم خانواده با A ………………………………………………..    44
3-3-5-    رابطه بین مقادیر ویژه ماتریس های AB و BA…………………………………………    45
3-3-6-    تعیین چند جمله ای مشخصه یک ماتریس…………………………………………………    47
3-3-6-1-    روش کریلف    …………………………………………………………………………………    47
3-3-6-2-    روش لورییر……………………………………………………………………………………….    49
3-3-6-3-    روش ضرایب نامعین…………………………………………………………………………..    50
3-3-7-    روش های تبدیلی در یافتن مقادیر ویژه……………………………………………………..    52
3-3-7-1-    روش ژاکوبی……………………………………………………………………………………..    52
3-3-7-2-    روش گیونز………………………………………………………………………………………..    54
3-3-7-3-    روش هاوس هلدر………………………………………………………………………………    55
3-3-8-    روش های مبتنی بر تجزیه ماتریس برای یافتن مقادیر ویژه…………………………..    57
3-3-8-1-    روش LR برای یافتن مقادیر ویژه………………………………………………………..    57
3-3-8-2-    روش QR برای یافتن مقادیر ویژه………………………………………………………..    60
کاربرد های تجزیه مقادیر منفرد…………………………………………………………………….    62
3-4-1-    کاربرد تجزیه مقادیر منفرد در پردازش سیگنال……………………………………………    63
الگوریتم های تشخیص نواحی سکوت و صدادار و بی صدا…………………………….    64
3-5-1-    تشخیص قسمت های سکوت با استفاده از قدرمطلق اندازه…………………………..    65
3-5-2-    روش نرخ عبور از صفر…………………………………………………………………………..    66
3-5-3-    روش های حوزه ی فرکانس…………………………………………………………………….    67
3-5-4-    روش کدینگ پیشگویی خطی(LPC)………………………………………………………..    68
3-5-5-    استفاده از تبدیل بسته موجک باز در تشخیص فریم های سکوت………………….    70

فصل چهارم- استفاده از تجزیه مقادیر منفرد در روش تفریق طیفی
4-1-    استفاده از تجزیه مقادیر منفرد در روش تفریق طیفی (روش SVSS)………………..    74
4-1-1-    قسمت تخمین نویز…………………………………………………………………………………    75
4-1-2-    فیلتر کردن مقادیر منفرد……………………………………………………………………………    76
4-1-2-1-    تعیین آستانه در فریم سکوت………………………………………………………………..     80
4-1-2-2-    تعیین آستانه در فریم بی صدا و صدا دار………………………………………………..     80
4-1-3-    قسمت تفریق طیفی…………………………………………………………………………………    85
تفریق طیفی با استفاده از SVD و الگوریتم های VADو V/UV detector…..    85
تفریق طیفی چند بانده با استفاده از SVD و الگوریتم هایVADوV/UV detector (SVMBSS)……………………………………………………………………………………    86

فصل پنجم- نتایج پیاده سازی و ارزیابی
5-1-    معیار های سنجش………………………………………………………………………………………    89
5-1-1-    نسبت سیگنال به نویز………………………………………………………………………………    89
5-1-2-    اسپکتروگرام (طیف نگاره)……………………………………………………………………….    89
5-1-2-1-    طراحی اسپکتروگرام……………………………………………………………………………     92
5-1-2-2-    نحوه توزیع مقادیر در اسپکتروگرام……………………………………………………….     95
5-1-3-    تست شنوائی………………………………………………………………………………………….    97
بررسی و مقایسه نتایج حاصله………………………………………………………………………    97
5-2-1-    تست شنوائی………………………………………………………………………………………….    104

فصل ششم- جمع­بندی و نتیجه­گیری
6-1-    جمع­بندی و نتیجه­گیری ……………………………………………………………………………..    108

فهرست جداول

عنوان    صفحه
جدول 1-1- تکنیک های مختلف غنی سازی گفتار……………………………………………………………    10
جدول 4-1- مقادیر بهینه درصد انرژی  ………………………………………………………………………..    83
جدول 5-1- نتایج غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط روش های PSS، ‍SVPSS، MBSS  وSVMBSS …………………………………………………………………………..
103
جدول 5-2- نمره کیفیت شنیدن نویز……………………………………………………………………………….    105
جدول 5-3- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
107

فهرست اشکال

عنوان    صفحه
شکل 1-1- برش عرضی سیستم صوتی انسان……………………………………………………………………    4
شکل 1-2- مدل زمان گسسته عمومی برای تولید سیگنال گفتار…………………………………………..    5
شکل 1-3- حرف بی صدا s……………………………………………………………………………………………    6
شکل 1-4- حروف صدادار e………………………………………………………………………………………….    6
شکل 1-5- تبدیل فوریه حرف بی صدای s………………………………………………………………………    6
شکل 1-6- تبدیل فوریه حرف صدا دار e…………………………………………………………………………    7
شکل 1-7- بلوک دیاگرام یک سیستم بهسازی مبتنی بر خاصیت تناوبی گفتار………………………..    11
شکل 1-8- بلوک دیاگرام یک سیستم غنی ساز مبتنی بر دامنه طیفی زمان – کوتاه…………………..    13
شکل 1-9- بلوک دیاگرام الگوریتم حذف نویز در حوزه موجک………………………………………….    15
شکل 1-10- دیاگرام کلی سیستم حذف کننده وفقی نویز……………………………………………………    17
شکل 2-1- بلوک دیاگرام تفریق طیفی توان (PSS)……………………………………………………………    23
شکل 2-2- بلوک دیاگرام تفریق طیفی تعمیم یافته (GSS)………………………………………………….    23
شکل 2-3- نمودار تعیین   از روی SNR (با فرض  )…………………………………………    26
شکل 2-4- SNR های مقطعی برای 4 باند فرکانسی گفتار نویزی………………………………………..    32
شکل 3-1- نمودار اندازه یک سیگنال صوتی بر حسب زمان……………………………………………….    66
شکل 3-2- بلوک دیاگرام آنالیز کپسترال……………………………………………………………………………    68
شکل 3-3- میزان خطای خروجی فیلتر معکوسLPC  به ازای حروف صدا دار و بی صدا……..    69
شکل 3-4- مرز تصمیم برای جداسازی قسمت های صدادار سیگنال……………………………………    72
شکل 4-1- بلوک دیاگرام کلی روش ارائه شده  SVD-Spectral Subtraction (SVSS)…….    75
شکل 4-2- فریم بی صدا در حوزه زمان……………………………………………………………………………    77
شکل 4-3- فریم صدا دار در حوزه زمان…………………………………………………………………………..    78
شکل 4-4- خود همبستگی در فریم سکوت آغشته به  نویز………………………………………………..    78
شکل 4-5- خود همبستگی در فریم بی صدا……………………………………………………………………..    79
شکل 4-6- خود همبستگی در فریم صدا دار…………………………………………………………………….    79
شکل 4-7- مقایسه مقادیر منفرد فریم های بی صدا و صدا دار ……………………………………………    79
شکل 4-8- مقادیر منفرد فریم سکوت نویزی…………………………………………………………………….    81
شکل 4-9- مقادیر منفرد فریم صدا دار  (الف) تمیز   (ب) نویزی با  SNR=10 db……………..    82
شکل 4-10- مقادیر منفرد فریم بی صدا  (الف) تمیز   (ب) نویزی با SNR=10 db……………..    82
شکل 4-11- بلوک دیاگرام روش بدست آوردن مقادیر بهینه آستانه………………………………………    83
شکل 5-1- هیستوگرام مقادیر فرکانسی…………………………………………………………………………….    96
شکل 5-2- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    99
شکل 5-3- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    100
شکل 5-4- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    101
شکل 5-5- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    102
شکل 5-6- متوسط غنی سازی ده سیگنال گفتار مختلف آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………………..
104
شکل 5-7- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
106

مقدمه:
با رشد روز افزون استفاده از سیستم های گفتاری در کاربردهای عملی روزمره، نیاز به حفظ کیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح شده است. شرایط ایده آل و عاری از نویز که در کارها و شبیه سازی های آزمایشگاهی در نظر گرفته می شود، در بسیاری از کاربردهای واقعی به طور جدی نقض گردیده و برقراری آنها زیر سئوال رفته است. به عنوان مثال استفاده از تلفن همراه، سمعک، سیستم بازشناسی گفتار و یا هر وسیله ارتباط گفتاری در یک محیط نویزی ، همگی از مواردی است که در آن حفظ کیفیت گفتار و بالا نگه داشتن کارایی سیستم، از اهمیت خاصی برخوردار است. بدون استفاده از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا که غیر قابل قبول می شود. از این رو، مبحث بهسازی گفتار به عنوان یکی از ضرورت های کاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده است.

فرضیات پایان نامه:
کلیه روش های شرح داده شده در پایان‌نامه و نیز کلیه روابط حاکم بر آنها، برمبنای سه فرض اساسی ذیل استوار می‌باشند.
–    نویز به سیگنال اضافه می شود.
–    فقط یک کانال در دسترس است.
–    سیگنال گفتار و نویز ناهمبسته هستند.
به این ترتیب آغشتگی سیگنال گفتار به نویز را می توان به شکل زیر مدل کرد:

که s(n) بیانگر سیگنال اصلی و تمیز صوت ، d(n) نویز آلوده کننده و G ضریب کنترل کننده انرژی نویز (و لذا کنترل کننده SNR) است. در این پایان‌نامه، این ضریب با   ادغام شده و یک سیگنال نویزی بصورت ذیل نمایش داده شده است:

فصل اول
مروری بر روش های عمده بهسازی گفتار

در این فصل ابتدا به بررسی خلاصه ای از چگونگی تولید گفتار در انسان پرداخته و سپس به بررسی اجمالی روش های عمده بهسازی گفتار و مسائل و مباحث موجود در این روش ها می پردازیم. در بررسی این روش ها سعی شده است تا ضمن بیان اصول و مبانی هر روش، نقاط ضعف و قوت آنها را ذکر کنیم.

1-1- مبانی تولید سیگنال گفتار
سیگنال گفتار جهت برقراری ارتباط بین گوینده و شنونده مورد استفاده قرار می گیرد. گوینده ازطریق یکسری فرآیندهای عصبی و حرکات ماهیچه ای موج سیگنال گفتار را تولید می کند و شنونده از طریق سیستم  شنیداری آن را دریافت کرده و سپس از پردازش آن را به سیگنال های عصبی بر می گرداند شکل (1-1) برش عرضی از سیستم تولید سیگنال گفتار را نشان می دهد. همانطورکه در شکل دیده می شود اجزای اصلی سیستم شامل شش ها، نای ( لوله هوا)، حنجره (که رکن اصلی در تولید صوت است.)، حفره حلقی (گلو)، حفره دهانی (دهان) و حفره دماغی (بینی) می باشد.

***ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است***

متن کامل را می توانید دانلود نمائید

چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)

ولی در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود است

تعداد صفحه :165

قیمت : چهارده هزار تومان

بلافاصله پس از پرداخت ، لینک دانلود به شما نشان داده می شود

و به ایمیل شما ارسال می شود.

پشتیبانی سایت :        09124404335        info@arshadha.ir

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

شماره کارت :  6037997263131360 بانک ملی به نام محمد علی رودسرابی

 

 

11

مطالب مشابه را هم ببینید

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه های دانشگاهی است. مطالب مشابه را هم ببینید. برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید

3 پاسخ

بخش دیدگاه ها غیر فعال است.