Internet

 

Kdaj pretvorba govora v besedilo

Raziskovalci se že petnajst let trudijo razviti zmogljiv programski vmesnik, ki bi tehnologijo za sintezo, prepoznavanje in prevajanje govora pripeljal v komercialno uporabo. Tehnologija obdelovanja slovenščine je zaradi jezikovnih zakonitosti mnogo bolj zapletena od denimo angleščine, zato potrebuje čas in »predvsem širšo finančno podporo, ki bi jo lahko prispevala država v spoznanju, da gre pri tem tudi za pobudo za ohranjanje slovenskega jezika,«

Natančnost pravilnega obdelovanja slovenskega jezika se za zdaj giblje med 60 in 70 odstotki ali drugače: v povprečju je napačna vsaka tretja beseda. »Zaradi zahtevne obdelave podatkov v realnem času je zgornja meja na trimegaherčnem procesorju Intel z 1 GB pomnilnika okoli 60.000 besed, za tekoče obdelovanje slovenščine pa je treba obdelati okoli 700.000 besed,«

Za pretvarjanje govora v besedilo, besedila v govor ali prevajanje slovenskega govora v tuji jezik se ne razvija umetna inteligenca, ampak se uporabljajo statistične metode obdelovanja na podlagi obsežnih baz govornih vzorcev. V ta namen še vedno teče pobuda prostovoljnega snemanja govorne baze polidat po fiksnem in mobilnem omrežju, k sodelovanju pa je povabljen vsakdo, ki pokliče na posebno brezplačno številko. Iz obeh omrežij se je doslej nabralo okoli tisoč govornih vzorcev, vendar še premalo, da bi računalnik govoril tekoče in z bolj naravno intonacijo.

Bo jezikovna tehnologija programsko in strojno učinkovita šele čez približno pet let. »To pa še ne pomeni, da nimamo na voljo oprijemljivih komercialnih rešitev; v zadnjem letu razvijamo v sodelovanju s podjetjem Iskratel razpoznavalnik govora za telefonske aplikacije, ki se ga bo še letos poskušalo prodati na pretežno analogni ruski trg.