nutqni tanish algoritmlari speech recognition

XudayshukurQoziboyev1 0 views 13 slides Sep 10, 2025
Slide 1
Slide 1 of 13
Slide 1
1
Slide 2
2
Slide 3
3
Slide 4
4
Slide 5
5
Slide 6
6
Slide 7
7
Slide 8
8
Slide 9
9
Slide 10
10
Slide 11
11
Slide 12
12
Slide 13
13

About This Presentation

speech recognition


Slide Content

МАВЗУ: Кириш. Автоматик нут ни таниш тизимлари
қ

НУТҚНИ ТАНИШ АЛГОРИТМЛАРИ
Алгоритмы распознавание речи

Режа:
1. Нутқни таниш тушунчаси
2. Нутқни танишнинг қисқача тарихи
3. Автоматик нутқни танаш тизимлари (АНТТ)
4. АНТТ турлари

Мустақил иш талаблари
•Формат А4
•Times New Roman 14
•Интервал 1
• Хужжат майдони: тепадан – 2 см, пастдан –
2 сm, чапдан – 3 сm, щнгдан – 1.5 сm.
•Рақамлаш пастдан ўнгдан
•Варақ сони мин 5 лист мах 7 лист.

Биринчи нутқни таниш қурилмаси 1952 йилда пайдо
бўлди. Бунда инсон рақамли талаффузини таниш мумкин
бўлган. 1962 йили Нью-Йоркедаги компьютер
технологиялари ярмаркасида IBM Shoebox қурилмаси
намойиш этилган.
Кўпчилик нутқни таниш тизимлари- таниш жараёнлари,
аналог сигналларни қайта ишлаш ва таҳлил
жараёнларидан ташкил топади. Аналог сигналларни
қайта ишлаш жараёнида нутқнинг хусусиятлари
ажратилиб, нутқни таниш жараёнлари учун айтилган сўз
топилади.

Нутқни таниш тушунчаси?
Нутқни таниш – рақамли маълумотларни сигнални нутқ кўринишида
қайта ишлаш жараёни

Нутқни таниш реал вақтда замонавий методлар асосида
катта ҳисоблаш ресурсларини талаб этади. Бундай
холатларда ресурслар чекланган бўлади. Бундай
алгоритмларни бугунги кунда қўллаш имконияти катта
қийинчиликлар олиб келади. Мисол сифатида мобил
курилмалар учун эффектив ва оптимизацион усулларни
қидириш жаарёнларида.

Тарихи
Энг биринчи Automatic Speech Recognition –
ASR тизимлар 1950-йилда ташкил топди.
Дикторга бо ли равишда урилиб,
ғ қ қ
ра амлар асосида танилган.
қ
•1960 йилларда Япония унли товушларни
махсус спектрал анализдан фойдаланиб унли
товушларни танувчи тизимлар яратди.

Тарих
1970- йилларда нутқни таниш соҳасида иккита очиқлилик
пайдо бўлди.биринчиси динамик дастурлаш усулларидан
фойдаланган (Dynamic Time Warping - DTW) бўлиб,
нутқли диалектларнинг вақтга текисланишига асосланган.
Иккинчиси чизиқли башоратли кодлашга асосланган
бўлиб, бунда хар бир сигнални таниш кичик битрейтларга
асосланади(битли маълумотларнинг сони, жўнатиш
секундига)
1980 йилларда асосий йўналиш шаблонларнинг
қўлланилишига асосланган бўлиб,бунда нутқни таниш
соҳасида статистик моделлардан фойдаланиш асосий
йўналиш бўлди.

Aculab
•Билиш аниқлиги 97%.
•Дикторга боғлиқ бўлмаган система. Ишлаб чиқарувчилар кўпгина
тиллар учун турли маълумотлар базаси асосида таҳлил ишларини
бажаришди ва турли турдаги нутқнинг холатлари инсоннинг ёшига,
акцентига, бугимларнинг шаклланишига боғлиқлигини аниқлашган.
•Тизим ўзида қўшимча словар ташкил этиш имкониятини ўзида намоён
этган.
•Тизимда британ тили, америкача инглиз тили, француз, немец, итальян,
испан тиллари нутқини таниш имкониятлари луғатлар асосида
жамланган. Луғатни бир тилдан иккинчи тилга ёки бошқа тилларга
ўзгартириш имконияти шаклланган лекин бир вақтнинг ўзида барча
тилларнинг луғатларидан фойдаланиш имконияти шаклланмаган.
•Тизим Windows NT/2000, Linux и Sun SPARC Solaris ОТ базаси асосида
ишлаш имконияти шакллантирилган

Babear SDK Version 3.0

Дикторга боғлиқ бўлмаган тизим, Аниқ бир фойдаланувчи бўлишини
талаб этмайди. Фойдаланувчининг мослашуви иш вақтида рўй беради ва
Адаптация под пользователя происходит во время работы и нутқни
танишда энг яхши натижага эришилади. Нутқни танишда кучли шумли
муҳитда овознинг активлиги автоматин созланади. Мисол учун
автомобил салонида.
Тизимда сўз топилмайди ва словарга қўйилмайди. Калит сўзларни
излаш имконияти кўрилади. Тизим кичик ёки катта ҳажмли словари
билан ишчи холатда бўлиши мумкин.
Тизим кўйидаги тилларни ўзида жамлайди: британ, америка инглиз
тили, инглизча, испанча немец тили, француз, датский, швед тили, турк
тили, грекча, исланд ва араб тиллари.
Тизим Windows 98 (SE)/NT 4.0/2000/CE, Mac OS X ва Linux ОТлар
ишлаш имконияти шаклланган .

Loquendo ASR

Дикторга боғлиқ бўлмаган тизим, телефония тизимларида фойдаланиш
учун оптималлаштирилган. Калит сўзларни излаш(луғат 500 та сўзгача),
Алоҳида сўзларни таниш имконияти шакллантирилган.
12 тилда ишлаш имконияти мавжуд. Кенг тарқалган оммавий европа
тиллари(итальян, испан, британ ва америка ча инглиз тили, француз,
немец, грек, швед ва бош.).
Таркибий махсулоти Loquendo Speech Suite булиб, шу билан биргаликда
text-to-speech тизими ва Loquendo VoiceXML Interpreter дастурларини ўз
ичига олади.турли овзлвр ва тиллардан фойдаланиш имконияти яратилган
Тизим MS Windows NT/2000, UNIX и Linux ОТ лар асосида ишлайди.

LumenVox
дикторга боғлиқ бўлмаган тизим. Ўрганиш жараёнини талаб қилмайди.
Мослашув жараёнидан сўнг, фойдаланувчи нутқни таниш натижасини
анчагина яхши аниқлайди. Таниш аниқлиги 90%
Турли турдаги аудио файлларни ўқий қобилиятига ега.(u-law 8 кГц, РСМ
8 кГц, РСМ 16 кГц). Аппарат ресурсларига катта талаб қўймайди.
Windows NT/2000/XP ва Linux ОТ илаш имкониятига эга.
Тизим аппарат таъминотига қуйидаги талабларни қўяди:
• Windows NT 4.0 c Service Pack 6a, Windows 2000 или Windows XP Pro;
• Intel Pentium III 800 MГц ёки ундан юқори;
• Минимум хотира ўлчами 512 Mбайт.
Требования к системе (на базе Red Hat Linux):
• Red Hat Linux 7.2;
• Intel Pentium III 800 MГц или выше;
• Объем памяти 256 Mбайт;
• Размер диска 17 Mбайт (после декомпрессии).

Этиборингиз учун рахмат!
Tags