Imię i nazwisko:
Adres email:

Poleć treść:


"Ivona" - nowoczesny syntezator mowy

Magda , 28 Maj 09 Dodaj komentarz Wyślij Drukuj

"Ivona" - nowoczesny syntezator mowy

Pierwsze syntezatory mowy powstały 20 lat temu. Miały pomagać osobom niepełnosprawnym, zwłaszcza niewidzącym, w korzystaniu z komputera. Jednak wydawane przez nie dźwięki tylko w niewielkim stopniu przypominały ludzką mowę.

Tymczasem - jak mówili na konferencji prasowej Kaszczuk i Osowski - powstała w 2005 roku "Ivona" emituje doskonałej jakości dźwięki. Kaszczuk zaznaczył przy tym, że aby syntezator przeczytał tekst ludzkim głosem musi mówić w danym języku, posługiwać się głosem konkretnej osoby i rozumieć tekst na tyle, by nadać mu odpowiednią interpretację.
Jak wyjaśnił Kaszczuk, pierwszym krokiem przy tworzeniu syntezatora jest przygotowanie modelu językowego. Trzeba zgromadzić ogromną liczbę różnego rodzaju zdań. "Przygotowujemy zdania z wielu różnych źródeł, bo teksty które odczytuje syntezator też są zróżnicowane. Korzystamy więc m.in. z informacji prasowych, literatury technicznej, książek" - wyjaśniał.

Kolejnym krokiem jest przygotowanie skryptu nagraniowego dla lektora, który w studiu nagrywa poszczególne zdania, nawet przez kilka dni. Kaszczuk zwrócił uwagę, że syntezator w tłumaczonych później tekstach przenosi niektóre cechy charakterystyczne lektora i mówi jego głosem. Teoretycznie - żartował - gdyby lektor seplenił syntezator robiłby później to samo.

Syntezator może też odczytywać zdania, które nie były wcześniej nagrane przez lektora. Odbywa się to przez sklejanie fragmentów wcześniej nagranych zdań. W analogiczny sposób może tworzyć również zupełnie nowe słowa.

"Ivona" może również odczytać tekst dostępny na stronie internetowej, w programie Word czy innego rodzaju programach - użytkownik musi go po prostu wprowadzić do systemu syntezatora.

"System zawiera różnego rodzaju programy, które pełnią rozmaite funkcje w zależności od potrzeby danego użytkownika" - tłumaczy Kaszczuk. Na przykład - za pomocą odpowiedniego programu - syntezator odczyta na ekranie komputera osoby niewidomej tekst- instrukcję umieszczony w okienku, a potem będzie służył za wirtualnego przewodnika po całym ekranie.

A jeśli mamy książkę w formacie PDF syntezator bez problemu ją odczyta. Wystarczy wówczas zaznaczyć wybrany fragment książki, skopiować go do programu "Ivona Player", który ten wybrany fragment tekstu odczyta. Po odsłuchaniu, można plik dźwiękowy np. zapisać w formacie MP3 i odtwarzać wielokrotnie.

Według twórców "Ivony", syntezator może być niezwykle przydatny w nauce języków obcych. Jeśli czytamy dany tekst np. w języku angielskim, a nie wiemy jak wymawia się dany wyraz, wystarczy go wrzucić do syntezatora, a on poda nam właściwą wymowę.

Kaszczuk i Osowski podkreślali że mechanizm, który odczytuje na głos zapisany tekst może być przydatny w wielu innych dziedzinach. Jedynie syntezatory umożliwiają odczytywanie na bieżąco zmieniających się treści. Dzięki temu są chętnie wykorzystywane w telekomunikacji i call center, mogą również odczytywać SMS-y, komunikaty w windach i systemach informacji pasażerskiej. Coraz częściej są też używane w prezentacjach multimedialnych i plikach audio umieszczanych na stronach internetowych.

Pomoc niepełnosprawnym w korzystaniu z komputera, ułatwienie nauki języków obcych i e-learningu, to tylko niektóre z zastosowań "Ivony" - nowoczesnego syntezatora mowy - zapewniali w Warszawie twórcy urządzenia Michał Kaszczuk i Łukasz Osowski z IVO Software. Pierwsze syntezatory mowy powstały 20 lat temu. Miały pomagać osobom niepełnosprawnym, zwłaszcza niewidzącym, w korzystaniu z komputera. Jednak wydawane przez nie dźwięki tylko w niewielkim stopniu przypominały ludzką mowę.

Tymczasem - jak mówili na konferencji prasowej Kaszczuk i Osowski - powstała w 2005 roku "Ivona" emituje doskonałej jakości dźwięki. Kaszczuk zaznaczył przy tym, że aby syntezator przeczytał tekst ludzkim głosem musi mówić w danym języku, posługiwać się głosem konkretnej osoby i rozumieć tekst na tyle, by nadać mu odpowiednią interpretację.
Jak wyjaśnił Kaszczuk, pierwszym krokiem przy tworzeniu syntezatora jest przygotowanie modelu językowego. Trzeba zgromadzić ogromną liczbę różnego rodzaju zdań. "Przygotowujemy zdania z wielu różnych źródeł, bo teksty które odczytuje syntezator też są zróżnicowane. Korzystamy więc m.in. z informacji prasowych, literatury technicznej, książek" - wyjaśniał.

Kolejnym krokiem jest przygotowanie skryptu nagraniowego dla lektora, który w studiu nagrywa poszczególne zdania, nawet przez kilka dni. Kaszczuk zwrócił uwagę, że syntezator w tłumaczonych później tekstach przenosi niektóre cechy charakterystyczne lektora i mówi jego głosem. Teoretycznie - żartował - gdyby lektor seplenił syntezator robiłby później to samo.

Syntezator może też odczytywać zdania, które nie były wcześniej nagrane przez lektora. Odbywa się to przez sklejanie fragmentów wcześniej nagranych zdań. W analogiczny sposób może tworzyć również zupełnie nowe słowa.

"Ivona" może również odczytać tekst dostępny na stronie internetowej, w programie Word czy innego rodzaju programach - użytkownik musi go po prostu wprowadzić do systemu syntezatora.

"System zawiera różnego rodzaju programy, które pełnią rozmaite funkcje w zależności od potrzeby danego użytkownika" - tłumaczy Kaszczuk. Na przykład - za pomocą odpowiedniego programu - syntezator odczyta na ekranie komputera osoby niewidomej tekst- instrukcję umieszczony w okienku, a potem będzie służył za wirtualnego przewodnika po całym ekranie.

A jeśli mamy książkę w formacie PDF syntezator bez problemu ją odczyta. Wystarczy wówczas zaznaczyć wybrany fragment książki, skopiować go do programu "Ivona Player", który ten wybrany fragment tekstu odczyta. Po odsłuchaniu, można plik dźwiękowy np. zapisać w formacie MP3 i odtwarzać wielokrotnie.

Według twórców "Ivony", syntezator może być niezwykle przydatny w nauce języków obcych. Jeśli czytamy dany tekst np. w języku angielskim, a nie wiemy jak wymawia się dany wyraz, wystarczy go wrzucić do syntezatora, a on poda nam właściwą wymowę.

Kaszczuk i Osowski podkreślali że mechanizm, który odczytuje na głos zapisany tekst może być przydatny w wielu innych dziedzinach. Jedynie syntezatory umożliwiają odczytywanie na bieżąco zmieniających się treści. Dzięki temu są chętnie wykorzystywane w telekomunikacji i call center, mogą również odczytywać SMS-y, komunikaty w windach i systemach informacji pasażerskiej. Coraz częściej są też używane w prezentacjach multimedialnych i plikach audio umieszczanych na stronach internetowych.

Źródło: Serwis Nauka w Polsce

 

 

Podziel się
KOMENTARZE
Aktualnie brak komentarzy. Bądź pierwszy, wyraź swoją opinię

DODAJ KOMENTARZ
Zaloguj się albo Dodaj komentarz jako gość.

Dodaj komentarz:



ZOBACZ TAKŻE
REKLAMA
SPOŁECZNOŚĆ
Kategorie
Technologia
NAJNOWSZE ARTYKUłY

Warszawska Liga Debatancka dla Szkół Podstawowych - trwa przyjmowanie zgłoszeń do kolejnej edycji

Redakcja portalu 29 Czerwiec 2022

Trwa II. edycja konkursu "Pasjonująca lekcja religii"

Redakcja portalu 29 Czerwiec 2022

#UOKiKtestuje - tornistry

Redakcja portalu 23 Sierpień 2021

"Moralność pani Dulskiej" Gabrieli Zapolskiej lekturą jubileuszowej, dziesiątej odsłony Narodowego Czytania.

Redakcja portalu 12 Sierpień 2021

RPO krytycznie o rządowym projekcie odpowiedzialności karnej dyrektorów szkół i placówek dla dzieci

Redakcja portalu 12 Sierpień 2021


OSTATNIE KOMENTARZE

Wychowanie w szkole, czyli naprawdę dobra zmiana

~ Staszek(Gość) z: http://www.parental.pl/ 03 Listopad 2016, 13:21

Ku reformie szkół średnich - część I

~ Blanka(Gość) z: http://www.kwadransakademicki.pl/ 03 Listopad 2016, 13:18

"Takie będą Rzeczypospolite, jakie ich młodzieży chowanie"

~ Gość 03 Listopad 2016, 13:15

"Takie będą Rzeczypospolite, jakie ich młodzieży chowanie"

~ Gość 03 Listopad 2016, 13:14

Presja rodziców na dzieci - Wykład Margret Rasfeld

03 Listopad 2016, 13:09


Powrót do góry
logo_unii_europejskiej