Mitch L (2025) AI’s Talent for Translation Lowers Language Barriers. Engineering 55.


Mitch L (2025) AI’s Talent for Translation Lowers Language Barriers, Engineering 55, 11-13 – https://doi.org/10.1016/j.eng.2025.09.019 – open access article pdf – CC BY-NC-ND 4.0

Članek raziskuje, kako napredek v umetni inteligenci (UI) spreminja svetovno komunikacijo, zlasti v znanosti, hkrati pa opozarja na preostale pomanjkljivosti te tehnologije. V nadaljevanju podajamo povzetek tega članka.

Izzivi za ne-angleško govoreče raziskovalce

  • Jezikovne ovire v znanosti: Znanstveniki, katerih materni jezik ni angleščina, se soočajo z večjimi ovirami; raziskava iz leta 2023 je pokazala, da je pri njih verjetnost zavrnitve članka zaradi kakovosti pisanja dvakrat večja.
  • Časovna potratnost: Raziskovalci, ki niso rojeni govorci angleščine, porabijo do 91 % več časa za branje in 51 % več časa za pisanje člankov v angleščini.
  • Omejitve pri udeležbi: Te osebe se redkeje udeležujejo mednarodnih konferenc in so lahko manj produktivne zaradi časa, ki ga namenijo premagovanju jezikovnih težav.

Tehnološki razvoj: Od statistike do transformatorjev

Razvoj strojnega prevajanja se je v zadnjem desetletju močno pospešil:

  • Statistično prevajanje (SMT): Prvotne različice (npr. zgodnji Google Translate) so besedilo razčlenile na fraze in iskale statistična ujemanja, pogosto pa so vse prevajale najprej v angleščino, kar je povzročalo napake.
  • Nevronske mreže: Okoli leta 2014 so nevronske mreže začele nadomeščati statistične modele, kar je omogočilo neposredno prevajanje med jeziki in boljšo analizo konteksta.
  • Modeli transformatorjev: Od leta 2017 modeli s funkcijo “samopozornosti” (self-attention) analizirajo celotna zaporedja besedila hkrati, kar znatno izboljša natančnost.
  • Veliki jezikovni modeli (LLM): Modeli, kot so GPT-4, Claude in Llama, so usposobljeni na trilijonih besed, zaradi česar so njihovi prevodi pogosto bolj tekoči od specializiranih prevajalskih orodij.

Zmogljivosti in tveganja

  • Primerjava s ljudmi: Na tekmovanju WMT 2024 so bili sistemi UI v 7 od 11 nalog enako dobri ali boljši od ljudi (npr. pri prevajanju iz angleščine v kitajščino ali ukrajinščino).
  • Pomanjkljivosti: UI še vedno težko razume sleng, kulturne reference, ton in slog. Modeli LLM lahko tudi halucinirajo (si izmišljujejo vsebino).
  • Nevarnosti napak: Napačni prevodi so v preteklosti že privedli do napačnih aretacij in celo smrti.
  • Podatkovna neenakost: Tehnologija deluje odlično le za jezike z veliko razpoložljivimi podatki; za večino od 7000 svetovnih jezikov kakovost ni zagotovljena.

Prihodnost prevajalskega poklica in znanosti

  • Vloga človeka: Strokovnjaki poudarjajo, da UI ne bo popolnoma nadomestila prevajalcev, temveč se njihovo delo spreminja v preverjanje in urejanje kritičnih dokumentov (pravnih, medicinskih).
  • Standardi in označevanje: Evropska unija že zahteva označevanje vsebine, ki jo ustvari UI, strokovna združenja pa si prizadevajo za mednarodne standarde prostovoljnega označevanja.
  • Vizija za znanost: UI bi lahko omogočila, da znanstveniki objavljajo v maternem jeziku, bralci pa bi besedila s pomočjo UI brali v svojem jeziku, kar bi povečalo dostopnost znanja.
  • Opomba: Čeprav so orodja, kot je Google Translate, brezplačna, so nekatera napredna orodja plačljiva, kar lahko ustvari nove neenakosti med bogatimi in revnejšimi raziskovalci.

URL: https://www.sciencedirect.com/science/article/pii/S2095809925005843