مدلی برای توصیف روش تولید گفتار

خلاصه
1397/06/06

تقریبا تمام تکنیک های ترکیب و تشخیص صحبت بر اساس مدل تولید صحبت انسان که ایجاد شده اند.

مدلی برای توصیف روش تولید گفتار


 تقریبا تمام تکنیک های ترکیب و تشخیص صحبت بر اساس مدل تولید صحبت انسان که ایجاد شده اند. بیشتر صداهای مربوط به صحبت انسان به دو دسته صدادار و سایشی تقسیم می شوند. اصوات صدادار وقتی که هوا از ریه ها و از مسیر تارهای صوتی به بیرون دهان یا بینی رانده می شوند ایجاد می گردند. تاره های صوتی دو رشته آویخته از بافت هستند که در مسیر جریان هوا کشیده شده اند. در پاسخ به کشش ماهیچه های متفاوت تاره های صوتی با فرکانس  بین 50 تا 1000 هرتز ارتعاش می کنند که باعث انتقال حرکت متناوب هوا در مقایسه، اصوات سایشی به صورت نویز تصادفی و نه حاصل از ارتعاش  تار های صوتی به وجود می آیند. این حادثه زمانی رخ می دهد که تقریبا جریان هوا به وسیله ی  زبان و لب ها یا دندان ها حبس می شود که این امر باعث ایجاد اغتشاش هوا در نزدیکی محل فشردگی می گردد.
در یک تکه زمان کوتاه، حدود 2 تا 40 میلی ثانیه صحبت می تواند با ستفاده از سه پارامتر مدل سازی شود:
1.    انتخاب یک آشفتگی متناوب یا نویزدار
2.     پیچ آشفتگی متناوب
3.    ضرایب یک فیلتر خطی بازگشتی که پاسخ اثر صوتی را تقلید می کند.