Maskinoversættelse
Flersprogethed set i lyset af maskin­oversættelse

Takket være en ny impuls inden for forskningen i kunstig intelligens er maskinoversættelse blevet bedre de seneste år. Hvordan fungerer denne teknologi, hvad kan den bruges til, og hvad er de potentielle konsekvenser for flersprogethed set i forhold til dannelsesidealet?

Af Ralph Krüger

Hvis man for nylig har brugt et maskinoversættelsessystem som for eksempel Google Oversæt, er man formentlig blevet behageligt overrasket over oversættelsens kvalitet. Hvor uforståelige tekster eller pinlige oversættelsesfejl tidligere har skabt en del moro, så foreslår softwaren nu oversættelser, der ikke blot gengiver indholdet på en meningsfuld måde, men som også virker sprogligt overbevisende. Hvad er der sket?

De neurale netværks sejrsgang

Vi finder svaret inden for forskningen i kunstig intelligens, som i de senere år har gjort store fremskridt takket være brugen af de såkaldte kunstige neurale netværk. Allerede i fyrrerne fik man den ide at efterligne den menneskelige hjernes opbygning med dens milliarder af nerveceller (neuroner) i form af kunstige netværk i en computer. I den seneste tid er de to sidste vigtigste forudsætninger for at kunne realisere ideen blevet opfyldt: en tilstrækkelig computerkraft såvel som adgang til store mængder data (Big Data), som man kan bruge til at oplære neurale netværk.
Denne tilgang, der også betegnes som Deep Learning, står i modsætning til tidligere tilgange inden for kunstig intelligens, hvor man forsøgte at klare opgaverne på baggrund af eksplicit programmerede regler. Kunstige neurale netværk analyserer derimod store datasæt for at finde særlige mønstre eller regelmæssigheder og udleder deraf egne – og for en menneskelig iagttager ofte uigennemskuelige – regler til at klare en bestemt opgave.

Den her skitserede modsætning finder man også inden for maskinoversættelse. Den såkaldt regelbaserede maskinoversættelse analyserer en kildesætning efter strengt grammatiske og leksikale regler og fremsætter gennem anvendelse af tilsvarende regler for målsproget et oversættelsesforslag. Ganske vist er naturlige sprog uhyrligt komplekse konstruktioner, som i modsætning til programmeringssprog kun udviser en vis form for regelmæssighed og er karakteriseret ved mange undtagelser og en vis grad af inkonsekvens. Derfor kan en regelbaseret tilgang kun opnå beskeden succes. I en neural maskinoversættelse oplæres et neuralt netværk derimod med store mængder data fra kildetekster og tilsvarende oversættelser og omdanner disse data til et oversættelsesmønster. På den måde opbygger man i bund og grund en kunstig oversætterhjerne, som på grundlag af de lagrede data lærer at oversætte nye tekster på egen hånd.

Maskinoversættelsens aktuelle niveau

Neuralt netværk
Neurale oversættelsesprogrammer skaber en kunstig oversætterhjerne. | Foto: Alfred Pasieka © mauritius images - Science Photo Library
Denne nye tilgang har opnået en bemærkelsesværdig succes. Den neurale maskinoversættelse er først taget ud af støbeskeen for bare fire år siden og har på kort tid lagt de hidtidige metoder langt bag sig, når det gælder kvalitet. I marts 2018 annoncerede et forskerhold fra Microsoft endda, at deres neurale oversættelsessystem efterhånden havde opnået ”human parity” i at oversætte avisartikler fra kinesisk til engelsk. Det vil altså sige, at de havde opnået en oversættelseskvalitet, som ikke står tilbage for en menneskelig oversætter.
 
Den slags udsagn skal dog tages med et gran salt og må på ingen måde udbredes til alle sprogretninger og fagområder. Også den neurale maskinoversættelse står stadig over for grundlæggende udfordringer. Et centralt problem er de naturlige sprogs iboende flertydighed. Mennesker fortolker altid sproglige udsagn ud fra en konkret kontekst. Således kan man ud fra udsagnet ”I arrived at the bank” ikke vide, om taleren er ankommet ved en flodbred eller et finansinstitut. Tilhøreren må fortolke udsagnet. Maskinoversættelsen er derimod blind over for konteksten og har dermed en principiel tendens til fejloversættelser. Drømmen om en sprogoversætter, der kunne overvinde den babylonske sprogforvirring, er altså stadig ikke blevet realiseret.

Maskinoversættelsens samfundsmæssige nytte

Selv om maskinoversættelsen ganske vist stadig slås med forskellige problemer, så er den alligevel et nyttigt værktøj til oversættelse, når man søger oplysninger. Ved hjælp af smartphones med adgang til internettet og andre mobile apparater har brugerne nu altid adgang til cloudbaserede oversættelsestjenester som Google Oversæt og kan bruge dem til at opnå en grundlæggende forståelse af en fremmedsproget tekst. En interessant nyskabelse er de såkaldte in-ear-oversættere som Googles Pixel Buds. Disse ledningsfri hovedtelefoner laver ved hjælp af talegenkendelse en fremmedsproget sætning om til maskinlæsbar tekst, som den lader Google Oversæt oversætte til det ønskede sprog for så at læse den højt. På den måde gøres maskinoversættelse brugbar i mundtlig kommunikation. Her øges fejlraten dog betydeligt som en følge af den tredobbelte flaskehals med sproggenkendelse, oversættelse og højtlæsning såvel som af den stærkt situationsafhængige hverdagskommunikation og det talte sprogs tendens til at være mindre struktureret.
 
Derudover findes der institutionelle bestræbelser på at gøre maskinoversættelse nyttig for samfundet. For eksempel planlægger Det Tyske Forskningscenter for Kunstig Intelligens et EU-støttet Human Language Project, der blandt andet har til formål at videreudvikle sprogteknologier for at forbedre adgangen til et flersproget EU for mennesker med ringe uddannelsesniveau, ældre og personer med migrationsbaggrund. Desuden undersøger forskere i EU-projektet INTERACT (International Network in Crisis Translation) for tiden, om maskinoversættelse kan benyttes i krisesituationer, hvor hurtig kommunikation på tværs af sprogbarrierer er af afgørende betydning.

Mennesker i samtale
En maskine kan ikke klare nuanceret kommunikation på tværs af sprogbarrierer. | Foto: stm © photocase.de
Om nytten af flersprogethed

Det indtil videre fremlagte kunne føre en til at drage den konklusion, at erhvervelsen af fremmedsprog i fremtiden bliver en luksusfornøjelse, som kun særligt sprogbegejstrede vil indlade sig på. Men dette indtryk bedrager. De kvalitetsproblemer, som maskinoversættelse stadig står over for, er allerede nævnt. En nuanceret kommunikation mellem forskellige sprogbrugere – som jo ikke alene er en sproglig, men også en kulturmæssig udveksling – ser ikke ud til nogensinde at kunne overtages af en maskine.
 
Fordelen ved at være flersproget bliver tydeliggjort netop af det forføreriske maskinelle alternativ. Hvis man undlader at tillægge sig et fremmedsprog, om end bare på et grundlæggende niveau, og kun nærmer sig fremmede kulturer gennem en maskine, går man ikke kun glip af en direkte og ufiltreret kommunikation med andre mennesker, men spærrer endvidere sig selv inde i det fængsel, ens eget sprog udgør. For ved at lære et nyt sprog lærer man også en ny måde at se verden på, en anden måde at omsætte virkeligheden til ord. Netop i den nye globaliserede verden med talrige muligheder for misforståelser og deraf opstående konflikter er en sådan tværkulturel empati uundværlig.
 

litteratur

Krüger, Ralph (2017): Von Netzen und Vektoren – Neuronale Maschinelle Übersetzung. I: MDÜ – Fachzeitschrift für Dolmetscher und Übersetzer, 63. Jg., H. 1.


 

Top