روش طراحی سیستم های تشخیص گوینده

خلاصه
1397/06/05

سیستم های تشخیص گوینده در حالت کلی به دو نوع سیستم های تایید هویت گوینده و سیستم های بازشناسی گوینده تقسیم می شوند


روش طراحی سیستم های تشخیص گوینده


سیستم های تشخیص گوینده در حالت کلی  به دو نوع سیستم های تایید هویت گوینده و سیستم های بازشناسی گوینده تقسیم می شوند. تفاوت این دو نوع سیستم در نحوه پذیرش ورودی است. عمل مدل سازی سیگنال یا استخراج خصیصه ها با حذف ویژگی های بدون استفاده ی سیگنال صحبت و حفظ ویژگی های قابل استفاده برای بازشناسی عبارات خاص، الگوهایی را با ویژگی های انتخاب شده در اختیار ما قرار می دهد. ساختار هایی که برای هر دو نوع سیستم ارائه شد هر دو دارای یک مرحله برای تشخیص میزان شباهت الگوهای متعلق به گوینده ی حاضر با گوینده ی مورد ادعا یا همه ی گویندگان است که با استفاده از آن معیاری برای تصمیم گیری در اختیار ما قرار داده می شود.
روشی برای یافتن میزان شباهت الگوها (روش مبتنی بر مقدار گزینی برداری)
یک مجموعه از بردارهای خصیصه ی بازه ی کوتاه زمانی یک گوینده که برای آموزش سیستم، به سیستم داده می شوند می توانند مستقیما برای نمایش ویژگی های مهم عبارت ایراد شده توسط وی بکار گرفته شوند.  در هر صورت نتیجه ی کار آنست که نیازمندی های حافظه برای ذخیره ی داده ها و پیچیدگی محاسباتی به سرعت با افزایش تعداد بردار های آموزش دهنده ی سیستم افزایش می یابد.
مقدار گزینی برداری اساسا روشی برای فشرده سازی داده های آموزش دهنده ی سیستم تا اندازه ی قابل مدیریت و کارا می باشد. با استفاده از یک دفتر کد مقدار گزینی برداری که شامل تعداد کمی بردارهای خصیصه است می توان داده های اولیه را به مجموعه ی کوچکی از نقاط نماینگر کاهش داد. یک گوینده می تواند بر اساس مکان مرکز ثقل بردارها از دیگری تشخیص داده شود.
 برای ایجاد یک مجموعه از نقاط گام های زیر اجرا شده اند:
-از دو گوینده خواسته شده تا چند دنباله عبارت برای آموزش سیستم بیان کنند.
-دنباله های آموزش دهنده ی سیستم تحلیل می شوند و برای آموزش دفتر کد مقدارگزینی برداری، استفاده می گردند.
-سپس نقاط به بخش های جداگانه افراز می گردند و 2 دفتر کد تولید می گردد که هر کدام 4 عنصر دارند. عناصر دفتر کد مقدار گرینی برداری به صورت دایره و مثلث نمایش داده می شوند و مرکز ثقل بخش های مرتبط با فضای خصیصه ی هر گوینده را نشان می دهد