مدلی برای توصیف روش تولید گفتار2

خلاصه
1397/07/23

مدلی برای توصیف روش تولید گفتاراصوات سایشی زبان انگلیسی عبارتند از TH،Z،S استفاده از یک مولد نویز نشان داده شده اند.

ادامه مدلی برای توصیف روش تولید گفتار
 
اصوات سایشی زبان انگلیسی عبارتند از TH،Z،S استفاده از یک مولد نویز نشان داده شده اند. هر نوع این اصوات، توسط چال های صوتی که از زبان، لب ها، دهان، گلو و گذرگاه های  بینی  تشکیل شده اند دچار تغییر می شوند. چون انتشار صدا در این ساختار ها یک فرایند خطی است می تواند  با استفاده از یک فیلتر خطی با یک پاسخ ضربه مناسب نمایش داده شود. در بیشتر موارد از یک فیلتر  بازگشتی که ضریب بازگشتی آن ویژگی های فیلتر را مشخص می کند استفاده می شود. به خاطر اینکه چال های صوتی ابعادی به اندازه چند سانتی متر دارند پاسخ فرکاسی یک دنباله از تشدیدها با اندازه های کیلو هرتزی است. در اصطلاح پردازش صوت این قله های تشدید فرکانس ها فرمانت خوانده می شوند. با تغییر جایگاه نسبی زبان و لب ها فرکانس های فرمانت هم از لحاظ دامنه و هم از لحاظ فرکانس ممکن است تغییر کنند.
سیگنال صوتی به تکه های کوچک به اندازه 2 تا 40 میلی ثانیه می شوند و از الگویتم  اف،اف، تی برای یافتن طیف فرکانسی هر تکه استفاده می شود. این طیف ها در کنار هم قرار  داده شده تبدیل به یک  تصویر سیاه و سفید می شود ( دامنه های پایین روشن و دامنه های بالا تیره می شوند). این کار یک روش گرافیکی برای مشاهده این که چگونه محتویات فرکانسی صحبت با زمان تغییر  می کند به وجود می آورد.اندازه هر تکه بر اساس اعمال بده یستان بین دقت فکانسی ( که با تکه های بزرگ تر بهتر می شود) و دقت زمانی ( که با تکه های کوچکتر  بهتر می شود)  انتخاب می گردد. به این نکته توجه کنید که نمایش زمان- فرکانس کلمه دو باری که  ادا شده شبیه