Hitri vstop:
Pojdi neposredno na sekundarno navigacijo (Alt 3)Pojdi neposredno na sekundarno navigacijo (Alt 3)Pojdi neposredno na glavno navigacijo (Alt 2)

Strojno prevajanje
Večjezičnost v luči strojnega prevajanja

Strojni »deep learning« se zgleduje po mreži živčnih celic.
Strojni »deep learning« se zgleduje po mreži živčnih celic. | Foto: Callista © plainpicture

Strojno prevajanje je zahvaljujoč se novim raziskavam umetne inteligence v zadnjih letih postalo bolj učinkovito. Kako deluje ta tehnologija, kakšno korist prinaša in kaj to pomeni za doseganje učnega ideala večjezičnosti?

Ralph Krüger

Kdor je v zadnjem času uporabil strojno prevajalsko orodje, kot je na premier Googlov prevajalnik, je bil lahko prijetno presenečen nad kakovostjo prevoda. Če so v preteklosti nerazumljiva besedila ali neprijetne prevodne napake pogosto poskrbele za zabavo, programska oprema zdaj predlaga prevajalske rešitve, ki ne reproducirajo zgolj smisla izvirnega besedila, temveč so tudi jezikovno prepričljive. Kaj se je zgodilo?

ZMAGOVALNI POHOD NEVRONSKIH MREŽ

Odgovor najdemo pri raziskavah umetne inteligence, ki so v zadnjih letih zahvaljujoč se uporabi tako imenovanih umetnih nevronskih mrež zelo napredovale. Že v štiridesetih letih preteklega stoletja so imeli raziskovalci idejo, da bi zgradbo človeških možganov z milijardami med seboj povezanih živčnih celic (nevronov) posnemali pri oblikovanju umetnih mrež v računalniku. Vsekakor pa so šele v zadnjem času izpolnili najpomembnejša pogoja za uresničitev te ideje: dovolj zmogljive računalnike in dostopnost velike množice podatkov (ključna beseda big data), s katerima lahko trenirajo nevronske mreže. Ta pristop, ki mu pravijo tudi deep learning, je drugačen od prejšnjih pristopov na področju umetne inteligence, ki skušajo zastavljene naloge rešiti na podlagi eksplicitno programiranih izhodišč. Umetne nevronske mreže po določenih vzorcih ali pravilnostih analizirajo veliko število podatkov in iz njih izpeljejo svoja – za človeškega opazovalca večinoma nedoumljiva – pravila za reševanje določene naloge.

Ta oris nasprotja najdemo tudi pri strojnem prevajanju. Tako imenovan strojni prevod, ki temelji na pravilih, stavek v izvirnem jeziku analizira po strogih predpisanih slovničnih in leksikalnih pravilih in ob uporabi ustreznih pravil v ciljnem jeziku naredi predlog prevoda. Vsekakor so naravni jeziki izredno kompleksne tvorbe, ki v nasprotju z jezikom programov odražajo le pogojno podrejenost pravilom in so zaznamovani s številnimi izjemami in deloma tudi protislovnostmi. Uspeh pristopa, ki temelji na pravilih, je temu ustrezno bolj skromen. V nasprotju s tem pa je pri nevronskem strojnem prevajanju nevronska mreža izurjena z velikim številom izvirnih besedil in njihovimi prevodi ter iz teh podatkov črpa določene prevodne vzorce. V principu gre za vzpostavitev umetnih prevajalskih možganov, ki se na podlagi shranjenih podatkov naučijo samostojnega prevajanja novih besedil.

TRENUTNA USPEŠNOST STROJNEGA PREVAJANJA

Nevronski prevajalski programi tvorijo umetne prevajalske možgane. Nevronski prevajalski programi tvorijo umetne prevajalske možgane. | Foto: Alfred Pasieka © mauritius images - Science Photo Library Uspeh tega novega pristopa je izreden. Nevronsko strojno prevajanje so uvedli pred komaj štirimi leti in je v najkrajšem možnem času s svojo kakovostjo močno prekosilo prejšnje pristope. Marca 2018 je Microsoftova raziskovalna skupina celo oznanila, da je nevronski prevajalski sistem pri prevajanju časopisnih člankov iz kitajščine v angleščino dosegel »human parity«, torej kakovost prevoda, ki prav nič ne zaostaja za kakovostjo besedila, ki bi ga prevedel človek.

Takšne izjave moramo vsekakor jemati z rezervo in jih nikakor ne moremo posploševati na vse smeri jezika in stroke. Na splošno velja: tudi nevronski strojni prevod se še vedno sooča z osnovnimi izzivi. Osrednja težava je inherentna večpomenskost naravnih jezikov. Ljudje jezikovne izjave vselej interpretiramo glede na določen kontekst. Tako iz izjave »I arrived at the bank« ni mogoče razbrati, ali je govorka prišla na breg reke ali v finančno ustanovo. Izjavo mora interpretirati poslušalec sam. Strojni prevod pa je slep za kontekst in zato hitro podleže napačnim prevodom. Zato sanje o univerzalnem prevajalniku, s katerim bi presegli babilonsko zmešnjavo, še zmeraj ne bodo postale resničnost.

DRUŽBENA KORIST STROJNEGA PREVAJANJA

Čeprav se bo strojno prevajanje tudi v prihodnje še borilo z različnimi težavami, ga lahko vseeno vidimo kot uporabno orodje za informativno prevajanje. Prek pametnih telefonov z internetno povezavo in drugih mobilnih naprav imajo uporabnice in uporabniki sedaj možnost kadar koli dostopati do prevajalskih storitev, ki temeljijo na oblaku, kot je Googlov prevajalnik, in jih lahko koristijo za rudimentarno razumevanje besedil v tujih jezikih. Zanimiva novost je tako imenovan prevajalnik v ušesu, kot je Googlov Pixel Buds. Te brezžične slušalke s pomočjo funkcije za prepoznavanje govora izjavo v tujem jeziku pretvorijo v besedilo, ki se ga da strojno prebrati, ter ga nato v Googlovem prevajalniku prevedejo v želen jezik ter na koncu reproducirajo kot govorjeno besedilo. Strojno prevajanje postane tako uporabno tudi pri govorni komunikaciji. Vendar pa se pri tem število napak občutno poveča zaradi trojnega sita prepoznavanja govora, prevajanja in glasovnega reproduciranja, odvisno pa je tudi od situacije vsakdanje komunikacije in tendenčno manjše strukturiranosti govorjenega jezika.

Poleg tega si tudi nekatere institucije prizadevajo, da bi strojno prevajanje uporabili v korist družbe. Tako se nemški Center za raziskovanje umetne inteligence na primer namerava prijaviti na evropski projekt Human Language Project, katerega cilj je med drugim v večjezično Evropo vključiti tudi ljudi z nižjo izobrazbo, starejše ljudi in ljudi z migracijskim poreklom. Poleg tega raziskovalke in raziskovalci pri evropskem projektu INTERACT (International Network on Crisis Translation) trenutno raziskujejo uporabnost strojnega prevajanja v primeru katastrof, kjer je ključnega pomena čim hitrejša komunikacija brez jezikovnih ovir.

Strojno prevajanje ne more zagotoviti niansirane komunikacije zunaj jezikovnih meja. Strojno prevajanje ne more zagotoviti niansirane komunikacije zunaj jezikovnih meja. | Foto: stm © photocase.de

O PREDNOSTIH VEČJEZIČNOSTI

Po dosedanjih opisih bi morda sklepali, da bo učenje tujih jezikov v prihodnosti postalo luksuz, ki si ga bodo privoščili samo še jezikovni navdušenci. Vendar je ta vtis zmoten. Omenili smo že težave s kakovostjo, s katerimi se strojno prevajanje sooča ves čas. Niansirane komunikacije med govorci različnih jezikov – ki seveda ni zgolj jezikovna, temveč tudi kulturna – stroji, kot kaže, nikoli ne bodo mogli prevzeti.

Prednosti večjezičnosti so očitne prav zaradi zavajajoče strojne alternative. Kdor se odpove učenju tujega jezika, pa četudi le na osnovni stopnji, in se tujim kulturam približa zgolj posredno preko strojev, se ne odpove samo direktni in nefiltrirani komunikaciji z drugimi ljudmi, temveč se tudi zapre v zapor lastnega jezika. Kajti z učenjem novega jezika nenazadnje spoznamo tudi nov pogled na svet, drugačen način ubesedovanja stvarnosti. V današnjem globaliziranem svetu z njegovimi številnimi možnostmi nerazumevanja in konfliktov, ki sledijo iz njih, je takšna mednarodna empatija nepogrešljiva.

 

literaturA

Krüger, Ralph (2017): Von Netzen und Vektoren – Neuronale Maschinelle Übersetzung. In: MDÜ – Fachzeitschrift für Dolmetscher und Übersetzer, 63. Jg., H. 1.