
Mitch L (2025) AI’s Talent for Translation Lowers Language Barriers, Engineering 55, 11-13 – https://doi.org/10.1016/j.eng.2025.09.019 – open access article pdf – CC BY-NC-ND 4.0
Članek raziskuje, kako napredek v umetni inteligenci (UI) spreminja svetovno komunikacijo, zlasti v znanosti, hkrati pa opozarja na preostale pomanjkljivosti te tehnologije. V nadaljevanju podajamo povzetek tega članka.
Izzivi za ne-angleško govoreče raziskovalce
- Jezikovne ovire v znanosti: Znanstveniki, katerih materni jezik ni angleščina, se soočajo z večjimi ovirami; raziskava iz leta 2023 je pokazala, da je pri njih verjetnost zavrnitve članka zaradi kakovosti pisanja dvakrat večja.
- Časovna potratnost: Raziskovalci, ki niso rojeni govorci angleščine, porabijo do 91 % več časa za branje in 51 % več časa za pisanje člankov v angleščini.
- Omejitve pri udeležbi: Te osebe se redkeje udeležujejo mednarodnih konferenc in so lahko manj produktivne zaradi časa, ki ga namenijo premagovanju jezikovnih težav.
Tehnološki razvoj: Od statistike do transformatorjev
Razvoj strojnega prevajanja se je v zadnjem desetletju močno pospešil:
- Statistično prevajanje (SMT): Prvotne različice (npr. zgodnji Google Translate) so besedilo razčlenile na fraze in iskale statistična ujemanja, pogosto pa so vse prevajale najprej v angleščino, kar je povzročalo napake.
- Nevronske mreže: Okoli leta 2014 so nevronske mreže začele nadomeščati statistične modele, kar je omogočilo neposredno prevajanje med jeziki in boljšo analizo konteksta.
- Modeli transformatorjev: Od leta 2017 modeli s funkcijo “samopozornosti” (self-attention) analizirajo celotna zaporedja besedila hkrati, kar znatno izboljša natančnost.
- Veliki jezikovni modeli (LLM): Modeli, kot so GPT-4, Claude in Llama, so usposobljeni na trilijonih besed, zaradi česar so njihovi prevodi pogosto bolj tekoči od specializiranih prevajalskih orodij.
Zmogljivosti in tveganja
- Primerjava s ljudmi: Na tekmovanju WMT 2024 so bili sistemi UI v 7 od 11 nalog enako dobri ali boljši od ljudi (npr. pri prevajanju iz angleščine v kitajščino ali ukrajinščino).
- Pomanjkljivosti: UI še vedno težko razume sleng, kulturne reference, ton in slog. Modeli LLM lahko tudi halucinirajo (si izmišljujejo vsebino).
- Nevarnosti napak: Napačni prevodi so v preteklosti že privedli do napačnih aretacij in celo smrti.
- Podatkovna neenakost: Tehnologija deluje odlično le za jezike z veliko razpoložljivimi podatki; za večino od 7000 svetovnih jezikov kakovost ni zagotovljena.
Prihodnost prevajalskega poklica in znanosti
- Vloga človeka: Strokovnjaki poudarjajo, da UI ne bo popolnoma nadomestila prevajalcev, temveč se njihovo delo spreminja v preverjanje in urejanje kritičnih dokumentov (pravnih, medicinskih).
- Standardi in označevanje: Evropska unija že zahteva označevanje vsebine, ki jo ustvari UI, strokovna združenja pa si prizadevajo za mednarodne standarde prostovoljnega označevanja.
- Vizija za znanost: UI bi lahko omogočila, da znanstveniki objavljajo v maternem jeziku, bralci pa bi besedila s pomočjo UI brali v svojem jeziku, kar bi povečalo dostopnost znanja.
- Opomba: Čeprav so orodja, kot je Google Translate, brezplačna, so nekatera napredna orodja plačljiva, kar lahko ustvari nove neenakosti med bogatimi in revnejšimi raziskovalci.
URL: https://www.sciencedirect.com/science/article/pii/S2095809925005843