Tekstove sa portala RTS-a automatski čita glas Dragana Vučelića

Portal RTS-a obnovio je opciju čitanja tekstova objavljenih na portalu koju najviše koriste slepi i slabovidi, ali i oni koji ne mogu da gledaju u ekran da bi sami čitali

    foto: RTS
    Podeli




Softver je postavila novosadska kompanija AlfaNum, specijalizovana za sintetizaciju glasa i pretvaranje glasa u tekst. Od 8. oktobra na sajtu RTS-a mogu da se preslušaju vesti uz pomoć AlfaNum-ovog najnovijeg sintetizatora baziranog na dubokim neuronskim mrežama, za koji je glas dao spiker, radijski i televizijski voditelj Dragan Vučelić dobitnik nagrade Radio-televizije Srbije za lepotu govora.

Ovaj tim koji je potekao sa Fakulteta tehničkih nauka u Novom Sadu, razvio je sintetičke, muške i ženske glasove za srpski, hrvatski i crnogorski jezik. Korišćenjem tehnologije za konverziju govora od malog uzorka nečijeg glasa AlfaNum za dve nedelje sintetizuje glas koji zvuči veoma slično glasu osobe čiji je snimak uzet kao osnova.

Primer za to je glas kojim govori digitalni asistent Raiffeisen banke REA. Osvajanjem ove tehnologije korišćenjem veštačke inteligencije stvorena je mogućnosti za razvoj aplikacija koje mogu da pomognu licima sa raznim oblicima invaliditeta kao i za razvoj velikog broja drugih aplikacija. Pomenuće se audio knjige, aplikacije za online nastavu koja je jako potrebna u sistemu obrazovanja, zvučna obaveštenja u kontakt centima u automobilskoj industriji u robotici.

Prošle godine portovana je sinteza na Android OS. Sva slepa i slabovida lica u Srbiji su dobila mogućnost da besplatno koriste ovu aplikaciju koja omogućava jednostavnu upotrebu svih funkcija uređaja koji koriste Android OS na maternjem jeziku. AlfaNum tim je radio i na unapređenju automatskog prepoznavanja govora, takođe baziranog na dubokim neuronskim mrežama.

Zahvaljujući tome završen je Sistem za automatsko prepoznavanje govora za diktiranje medicinskih nalaza za potrebe PIO Fonda koji će ubuduće olakšati rad lekara koji neće više gubiti vreme na kucanje dijagnoza. Ovako unapređene govorne tehnologije danas omogućavaju znatno širu primenu u poslovnom i privatnom okruženju kao i očuvanje srpskog i srodnih jezika u novom domenu govorne komunikacije - između čoveka i mašina.

Komentari(0)

sortiraj