KI und Sprachen
Wie künstliche Intelligenz dabei helfen kann, aussterbende Sprachen zu erhalten

13 männliche Maasai-Stammesangehörige im Masai Mara National Reserve stehen im Halbkreis, einer von ihnen in der Mitte des Bildes springt kniehoch in die Luft.
Foto: Jack Carter / Unsplash

Während immer mehr von künstlicher Intelligenz inspirierte Spracherhaltungsinitiativen entstehen, argumentieren Forscher*innen, dass diese zwar nicht das Wesen von Sprache voll erfassen können, aber dennoch ein entscheidender Aspekt bei der Erhaltung dessen sind, was mittlerweile als globale linguistische Katastrophe gilt.

Von Bob Koigi

Die 92-jährige Chilenin Cristina Calderon ist die letzte Sprecherin der Yamana-Sprache, die in Südamerika vom indigenen Volk der Yagan seit Jahrtausenden gesprochen wurde. Bis 2005 konnte sie die Sprache noch mit ihrer Schwester sprechen, aber seit deren Tod gibt es niemanden mehr, mit dem sie kommunizieren könnte. Auch wenn Cristina nicht die einzige im Yagan-Volk ist, die die Sprache beherrscht, hatte sie in einem älteren Interview bereits angedeutet, dass die jüngeren Generationen die Sprache meiden und Sprachen bevorzugen, die sie als modern betrachten. Cristina, das einzige lebende Archiv der Sprache und Kultur der Yagán, befürchtet, dass sie zusammen mit ihrer Sprache sterben wird. 

Tausende von Kilometern entfernt, in der kenianischen Rift-Valley-Region, liegt Yakunte im Sterben, eine Sprache des Stammes der Yaaku, einer Nebenlinie der Massai-Gemeinschaft. Sie wird nur noch von weniger als sieben Menschen gesprochen, die alle über 70 Jahre alt sind. Die jüngere Generation identifiziert sich mit der weitläufigeren Kultur und Sprache der Massai. Yakunte ist eine der sieben indigenen Sprachen Kenias, die von der UNESCO als ausgestorben eingestuft wurden. 

Der UNESCO-Weltatlas der gefährdeten Sprachen schätzt, dass mindestens 43 Prozent der 6000 Sprachen, die weltweit gesprochen werden, bedroht sind oder unmittelbar vor dem Aussterben stehen. Alle zwei Wochen stirbt eine Minderheitensprache. Weitere Berichte untermauern, was Forscher*innen und Linguist*innen als besorgniserregendes Phänomen für die Bewahrung von Kulturen und Traditionen beschreiben, die die Vielfalt der Menschheit über die Jahre hinweg charakterisiert haben. 

Angesichts dieser Bedrohung erklärten die Vereinten Nationen 2019 zum Internationalen Jahr der indigenen Sprachen, mit dem Ziel, die Notwendigkeit der Bewahrung von Erbe und Kultur hervorzuheben: „Durch die Sprache bewahren die Menschen die Geschichte, Bräuche und Traditionen sowie das Gedächtnis und einzigartige Denkweisen, Bedeutungen und Ausdrucksweisen ihrer Gemeinschaften. Sie gestalten zudem mit ihnen ihre Zukunft. Sprache ist für die Bereiche Menschenrechtsschutz, verantwortungsbewusste Regierungsführung, Friedenskonsolidierung, Versöhnung und nachhaltige Entwicklung entscheidend“, heißt es in einer Erklärung auf der Website.  

Cristina Calderon ist die letzte überlebende Sprecherin der einheimischen Yamana-Sprache in Chile
Cristina Calderon ist die letzte überlebende Sprecherin der einheimischen Yamana-Sprache | © Ridinghood, Alamy Stock Photo
Für das Verschwinden dieser Sprachen wurden Globalisierung und Technologie verantwortlich gemacht. Man schätzt, dass beinahe die Hälfte aller Online-Inhalte weltweit englisch oder chinesisch sind, was für die digitale Einführung anderer Sprachen wenig Raum lässt. 

„Sprache ist der Angelpunkt und die Achse jeder Kultur und der Identität jedes Individuums“, erklärt Harry Kiema von der Fakultät für Linguistik & Sprachen an der Universität Nairobi. „Sie ist die Definition der Menschheit und das, was sie umgibt. Die Bewahrung einer Kultur wird über die Generationen hinweg mündlich weitergegeben, durch die Sprache. Deshalb sollte der Verlust jeder Sprache, egal, wie viele Menschen sie sprechen, Anlass zur Sorge geben. Die Welt und die Vielfalt, wie wir sie kennen, wurden durch die Mischung von Kulturen und Sprachen möglich gemacht.“

Aber dieselbe Technologie, die für ihren Anteil an der Sprachenarmut kritisiert wurde, wird nun für ihre Rolle bei der Rettung der letzten indigenen Sprachen gefeiert. Künstliche Intelligenz, KI, wurde als Wundermittel gepriesen, das unaufhörlich die Herausforderungen von Spracherhaltung und Übersetzung analysiert. Die Technologie hat sich mithilfe von maschinellem Lernen für die Verarbeitung und Speicherung von Daten mit eindrucksvoller Geschwindigkeit als effektiv erwiesen, während sie gleichzeitig Muster erkennt und auch neue erstellen kann.

Auf diesem Weg hat die künstliche Intelligenz sichergestellt, dass vom Aussterben bedrohte Sprachen leicht zugänglich sind, indem sie sich mit Übersetzungsunterschieden befasst, die bei diesen Sprachen auftreten können. 
Das westgeorgische Dorf Ushguli
Die Sprache Svan in Westgeorgien gilt als definitiv gefährdet | Photo credit: Zoltan Tasi / Unsplash
Multinationale Konzerne haben massiv in diesen Bereich investiert, weil ihnen die zentrale Rolle der Sprache im menschlichen Leben bewusst ist. Microsoft beispielsweise betreibt den Microsoft Translator Hub, eine Plattform, die es Gemeinschaften und Institutionen ermöglicht, die neuronalen Text- und Sprachübersetzungssysteme für die Entwicklung ihrer eigenen Übersetzungswerkzeuge zu nutzen. 
Auch Google arbeitet mit Entwickler*innen und Institutionen zusammen, um mithilfe von Open-Source-KI-Plattformen wie TensorFlow einzigartige Übersetzungsmodule zu entwickeln, die Millionen von Transkriptionsstunden ersparen. 

Der nigerianische Innovator Gabriel Emmanuel hat eine KI-Plattform namens OBTranslate entwickelt, die Kommunikationshürden beseitigen möchte, indem sie über 2000 afrikanische Sprachen übersetzt und gleichzeitig für die Nachwelt erhält. 

„Zu dieser Initiative inspirierten mich die reichhaltigen Kulturen und vielfältigen Sprachen Afrikas“, erzählte Emmanuel FairPlanet in einem früheren Interview. „In Afrika gibt es über 2000 Sprachen in 54 Ländern, 63% der subsaharischen Gesamtbevölkerung leben in ländlichen Gebieten und sprechen in diesen Regionen mehr als 2000 Sprachen.“

„Zudem gibt es in Afrika mehr als 52 indigene Sprachen, die ausgestorben sind, die keine Muttersprachler*innen und keine gesprochenen Nachfolger mehr haben. Als junger Erfinder im Bereich ICT und Robotik bin ich davon überzeugt, dass die Entwicklung von Innovationen [Robotern] zur Lösung lokaler Probleme nicht nur auf die englische Sprache beschränkt sein sollte.“

Das ARC-Exzellenzzentrum für die Dynamik von Sprachen (ARC Centre of Excellence for the Dynamics of Language, CoEDL), eine australische Institution mit dem Ziel, bedrohte Sprachen auf dem Kontinent zu erhalten, hat einen Roboter namens Opie entwickelt, der auf der Open-Source-KI-Plattform TensorFlow aufbaut und Kindern mithilfe von Lektionen, Geschichten und Spielen indigene Sprachen beibringt. Der Roboter beobachtet und verzeichnet die Lernkapazitäten der Kinder, um ihren Lehrer*innen zu ermöglichen, ihre Fortschritte zu verfolgen. 
Keine Worte erforderlich: Ein traditioneller Maori "hongi" Gruß
Keine Worte erforderlich: Ein traditioneller Maori "hongi" Gruß | © Gary Blake / Alamy Stock Photo
In Neuseeland entwickelte der Student Jason Lovell, dem es schwerfiel, die indigene Sprache der Maori zu lernen, einen Facebook-Chatbot namens Reobot, der mithilfe künstlicher Intelligenz Nachrichten sowohl auf Maori als auch auf Englisch versteht und beantwortet. Lovell interessiert sich für neue Wege, seine indigene Sprache zu erhalten und sie mit der ganzen Welt zu teilen, und hofft daher, den Chatbot für den Umgang mit gesprochener Sprache upgraden zu können.

Und während immer mehr von künstlicher Intelligenz inspirierte Spracherhaltungsinitiativen entstehen, argumentieren Forscher*innen, dass diese zwar nicht das Wesen von Sprache voll erfassen können, aber dennoch ein entscheidender Aspekt bei der Erhaltung dessen sind, was mittlerweile als globale linguistische Katastrophe gilt.

„Beim Einsatz von Technologie zur Erhaltung indigener Sprachen bestehen prinzipielle Herausforderungen, weil die meisten dieser Sprachen das geschriebene und das gesprochene Wort mischten“, erklärt Harry Kiema. „Aussprache, Diktion und Gesichtsausdruck lassen sich selbst mit modernsten Technologien nicht erfassen. Deshalb gehen bei der Übersetzung zwangsläufig Bedeutungen verloren. Trotzdem ist die Erhaltung bestimmter Aspekte von Sprachen in digitalen Archiven, die nicht gelöscht werden können, an sich schon ein enormer Meilenstein.“

Dieser Artikel wurde ursprünglich im November 2020 auf der Website von FairPlanet publiziert, einem 2014 in Berlin gegründeten Sozialunternehmen mit dem Ziel, die Menschenrechte zu fördern, unsere Biosphäre zu schützen und nachhaltige Entwicklungsziele auf der ganzen Welt zu unterstützen.

Top