Samodejno prepoznavanje govora ali pretvorba govora v besedilo – Glosar NVIDIA

Samodejno prepoznavanje govora (angl. automatic speech recognition – ASR) ali pretvorba govora v besedilo (angl. speech-to-text) je kombinacija postopkov in programske opreme, ki dekodirajo človeški govor in ga pretvorijo v digitalizirano besedilo.

Prispevek razloži, kaj je to samodejno prepoznavanje govora, ki je nujno kot vhodni podatek za analizo naravnega jezika (angl. natural language procesing – NLP), ki se uporabi na besedilu, ki ga zapiše samodejno prepoznavanje govora. Prispevek nadalje povzema razloge za razvoj in uporabe te tehnologije, kot tudi kako deluje. Prispevek poudari pomen grafične procesne enote (angl. Graphics Processing Unit – GPU) in globokega učenja (angl. deep learning) za hitrost samodejnega prepoznavanja govora ter pšoudari vlogo firme NVIDIA pri razvoju te tehnologije, ki se uporablja recimo pri zdravstvenem varstvu, finančnih storitvah ali trgovini na drobno.

URL: https://www.nvidia.com/en-us/glossary/speech-to-text/