КампутарыПраграмнае забеспячэнне

Сінтэзатары прамовы з рускімі галасамі. Лепшы сінтэзатар гаворкі. Як карыстацца сінтэзатарам гаворкі?

Сёння сінтэзатары прамовы, якія прымяняюцца ў стацыянарных кампутарных сістэмах ці мабільных прыладах, чымсьці незвычайным ўжо не здаюцца. Тэхналогіі ступілі далёка наперад і дазволілі прайграць чалавечы голас. Як усё гэта працуе, дзе ўжываецца, які лепшы маўленчай сінтэзатар і з якімі патэнцыяльнымі праблемамі можа сутыкнуцца карыстальнік, глядзіце ніжэй.

Што ўяўляюць сабой маўленчыя сінтэзатары і дзе яны ўжываюцца?

Сінтэзатары прамовы ўяўляюць сабой адмысловыя праграмы, якія складаюцца з некалькіх модуляў, якія дазваляюць пераводзіць набраны на клавіятуры тэкст у звычайную чалавечую прамову ў выглядзе гукавога суправаджэння.

Было б наіўна лічыць, што спадарожныя бібліятэкі ўтрымліваюць абсалютна ўсе словы або магчымыя фразы, запісаныя ў студыях рэальнымі людзьмі. Гэта проста фізічна немагчыма. Да таго ж бібліятэкі фраз мелі б такі памер, што ўсталяваць іх нават на сучасныя вінчэстары вялікага аб'ёму, не кажучы ўжо аб мабільных девайсах, проста не ўяўлялася б магчымым.

Для гэтага была распрацавана тэхналогія, якая атрымала назву Text-to-Speech (пераклад тэксту ў размова).

Найбольш шырокае распаўсюджванне сінтэзатары прамовы атрымалі ў некалькіх абласцях, да якіх можна аднесці самастойнае вывучэнне замежных моў (праграмы нярэдка маюць падтрымку ў 50 мовах і больш), кода трэба пачуць правільнае вымаўленне словы, праслухоўванне тэкстаў кніг замест чытання, стварэнне маўленчых і вакальных партый у музыцы , выкарыстанне іх людзьмі з абмежаванымі магчымасцямі, выдача пошукавых запытаў у выглядзе агучаных слоў і фраз і т. д.

разнавіднасці праграм

У залежнасці ад вобласці прымянення, усе праграмы можна падзяліць на два асноўных тыпу: стандартныя, непасрэдна пераўтваральныя тэкст у гаворка, і маўленчыя або вакальныя модулі, якія прымяняюцца ў музычных прыкладаннях.

Для больш поўнага разумення карціны разгледзім абодва класа, але большы ўпор будзе зроблены ўсё ж такі на сінтэзатары прамовы ў іх непасрэдным прызначэнні.

Плюсы і мінусы найпростых маўленчых прыкладанняў

Што ж тычыцца пераваг і недахопаў праграм такога тыпу, спачатку разгледзім усё ж такі недахопы.

Перш за ўсё трэба дакладна разумець, што кампутар - ён і ёсць кампутар, які на дадзеным этапе развіцця чалавечую гаворка можа сінтэзаваць вельмі прыблізна. У найпростых праграмах часцяком назіраюцца праблемы з пастаноўкай націскаў у словах, паніжаны якасць гуку, а ў мабільных прыладах - павышаную энергаспажыванне, а часам і несанкцыянаваная загрузка маўленчых модуляў.

Але і пераваг хапае, бо вельмі многія гукавую інфармацыю ўспрымаюць значна лепш, чым візуальную. Зручнасць ўспрымання наяўнасці.

Як карыстацца сінтэзатарам гаворкі?

Зараз некалькі слоў аб асноўных прынцыпах выкарыстання праграм такога тыпу. Ўсталяваць сінтэзатар гаворкі любога тыпу можна без асаблівых праблем. У стацыянарных сістэмах выкарыстоўваецца стандартны ўсталёўнік, дзе асноўнай задачай стане выбар падтрымоўваных моўных модуляў. Для мабільных девайсов установачны файл можна спампаваць з афіцыйнага крамы або сховішчы накшталт Google Play або AppStore, пасля чаго прыкладанне ўсталюецца ў аўтаматычным рэжыме.

Як правіла, пры першым запуску ніякіх налад, акрамя ўстаноўкі мовы па змаўчанні, вырабляць не трэба. Праўда, часам праграма можа прапанаваць выбраць якасць гучання (у стандартным варыянце, ўжывальным паўсюдна, частата дыскрэтызацыі 4410 Гц, глыбіня 16 біт і бітрэйт 128 кбіт / с). У мабільных прыладах гэтыя паказчыкі ніжэй. Тым не менш за аснову бярэцца пэўны голас. З выкарыстаннем стандартнага шаблону вымаўлення шляхам прымянення фільтраў і эквалайзераў дасягаецца гучанне менавіта такога тэмбру.

У выкарыстанні можна выбраць некалькі варыянтаў перакладу тэксту: увод тэксту ўручную, агучванне ўжо які мае тэксту з файла, інтэграцыя ў іншыя прыкладання (напрыклад, вэб-браўзэры) з актывацыяй выдачы пошукавых вынікаў або прачытання тэкставага змесціва на старонках онлайн. Дастаткова выбраць патрэбны варыянт дзеянняў, мова і голас, якім усё гэта будзе прамаўляцца. Многія праграмы маюць некалькі разнавіднасцяў галасоў: як мужчынскіх, так і жаночых. Для актывацыі працэсу прайгравання звычайна выкарыстоўваецца кнопка старту.

Калі казаць пра тое, як адключыць сінтэзатар прамовы, тут можа быць некалькі варыянтаў. У самым простым выпадку выкарыстоўваецца кнопка прыпынку прайгравання ў самой праграме. У выпадку інтэграцыі ў браўзэр дэактывацыя вырабляецца ў наладах пашырэньні або поўным выдаленнем плагіна. А вось з мабільнымі прыладамі, нягледзячы на непасрэднае адключэнне, могуць быць праблемы, пра якія будзе сказана асобна.

У музычных праграмах налады і ўвод тэксту нашмат складаней. Напрыклад, у дадатку FL Studio ёсць свой маўленчай модуль, у якім можна выбраць некалькі тыпаў галасоў, змяніць налады танальнасці, хуткасці прайгравання і т. Д. Для пастаноўкі націскаў перад складам выкарыстоўваецца сімвал «_». Але і такі сінтэзатар падыходзіць толькі для стварэння робатызаваных галасоў.

Але вось пакет Vocaloid ад Yamaha ставіцца да праграм прафесійнага тыпу. Тэхналогія Text-to-Speech тут рэалізавана ў найбольш поўным аб'ёме. У наладах, акрамя стандартных параметраў, можна выставіць артыкуляцыю, глиссандо, выкарыстоўваць бібліятэкі з вакалам прафесійных выканаўцаў, складаць словы і фразы, падганяючы іх пад ноты, і яшчэ кучу за ўсё. Нядзіўна, што пакет толькі з адным вакалам займае каля 4 Гб і больш ва ўстановачнай дыстрыбутыве, а пасля распакавання - удвая-ўтрая больш.

Сінтэзатары прамовы з рускімі галасамі: кароткі агляд самых папулярных

Але вернемся да самых простым прыкладанням і разгледзім самыя папулярныя з іх.

RHVoice - на думку большасці экспертаў, лепшы сінтэзатар прамовы, які з'яўляецца расійскай распрацоўкай аўтарства Вольгі Якаўлевай. У стандартным варыянце даступна тры галасы (Аляксандр, Ірына, Алена). Налады простыя. А само прыкладанне можа выкарыстоўвацца і як самастойная праграма, сумяшчальная з SAPI5, і як экранны модуль.

Acapela - досыць цікавае прыкладанне, галоўнай асаблівасцю якога з'яўляецца амаль ідэальная агучка тэксту больш чым на 30 мовах свету. У звычайнай версіі, праўда, даступны толькі адзін голас (Алена).

Vocalizer - магутнае прыкладанне з жаночым голасам Milena. Вельмі часта гэтая праграма ўжываецца ў call-цэнтрах. Маецца мноства налад пастаноўкі націску, гучнасці, хуткасці чытання і ўстаноўкі дадатковых слоўнікаў. Галоўнае адрозненне складаецца ў тым, што маўленчай рухавічок можа ўбудоўвацца ў праграмы накшталт Cool Reader, Moon + Reader Pro або Full Screen Caller ID.

Festival - вельмi магутная ўтыліта сінтэзу і распазнавання прамовы, створаная для сістэм Linux і Mac OS X. Дадатак пастаўляецца з адкрытым зыходным кодам і, акрамя стандартных моўных пакетаў, мае падтрымку нават фінскай мовы і хіндзі.

eSpeak - маўленчае прыкладанне, якое падтрымлівае больш за 50 моў. Галоўным недахопам лічыцца захаванне файлаў з сінтэзаванай прамовай выключна ў фармаце WAV, які займае ўжо вельмі шмат месца. Затое праграма з'яўляецца кросплатформеннай і можа выкарыстоўвацца нават у мабільных сістэмах.

Праблемы з сінтэзатарам гаворкі ў Google Android

Пры ўсталёўцы «роднага» сінтэзатара гаворкі ад Google, карыстальнікі пастаянна скардзяцца на тое, што ён самаадвольна ўключае загрузку дадатковых моўных модуляў, што можа не толькі займаць досыць працяглы прамежак часу, але яшчэ і расходуе трафік.

Пазбавіцца ад гэтага ў Android-сістэмах можна вельмі проста. Для гэтага выкарыстоўваем меню налад, далей пераходзім у раздзел мовы і галасавога ўводу, выбіраем галасавы пошук і на параметры распазнання прамовы оффлайн націскаем на крыжык (адключэнне). Дадаткова рэкамендуецца пачысціць кэш прыкладанняў і перазагрузіць прылада. Часам можа спатрэбіцца ў самым дадатку адключыць паказ апавяшчэнняў.

Што ў выніку?

Паводзячы нейкі вынік, можна сказаць, што ў большасці выпадкаў шараговым карыстальнікам падыдуць самыя простыя праграмы. Ва ўсіх рэйтынгах лідзіруе RHVoice. Але для музыкаў, якія хочуць дамагчыся натуральнага гучання голасу, каб розніца паміж жывым вакалам і кампутарным сінтэзам ня адчувалася на слых, лепш аддаць перавагу праграмам тыпу Vocaloid, тым больш што для іх выпускаецца мноства дадатковых галасавых бібліятэк, а налады маюць столькі магчымасцяў, што прымітыўныя прыкладання, як той казаў, і побач не стаялі.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 be.unansea.com. Theme powered by WordPress.