Fokus: Zahlenspiele
Die Rückkehr der Schreibmaschinen

Sind Roboterjournalisten die Zukunft?
Sind Roboterjournalisten die Zukunft? | Foto: The Cookiemonster, via flickr (CC BY-SA 2.0)

Mehrsprachig und blitzschnell: Software, die Texte eigenständig verfasst, wird im Journalismus üblicher werden. Dieser sogenannte Roboterjournalismus könnte Arbeit in den Redaktionen erleichtern - aber auch Arbeitsplätze kosten.
 

Zwiespältig – so lässt sich wohl das Verhältnis der meisten Menschen zu Robotern beschreiben. Zum einen kommen ihnen sympathische Maschinen, wie der kleine R2D2 aus den Star Wars-Filmen, in den Sinn. Auf der anderen Seite stehen Bilder wie die der anonymen Industrieroboter, die oft mit Arbeitsplatzabbau in Verbindung gebracht werden. Insofern ist der Begriff Roboterjournalismus, auch wenn etwas albern klingt, recht passend: Er drückt eine Ambivalenz aus.

Software kann mittlerweile ganz passable Berichte schreiben: Keine Reportagen, Glossen oder Kommentare zwar, aber kurze Spielberichte zum Fußball etwa oder eine Nachricht über die Entwicklung eines Wertpapiers an der Börse. Dabei hat die Software ihren menschlichen Kollegen vor allem drei Sachen voraus: Zum einen die Geschwindigkeit – ein Text wird in deutlich weniger als einer Sekunde generiert. Zweitens können die enthaltenden Fakten gegen diverse Datenbanken äußerst fix abgeglichen und korrigiert werden. Und ein Roboterjournalist kann den Text gleichzeitig in mehreren Sprachen ausgeben.

Einprogrammiertes Wissen

Mit dieser Fähigkeit wirbt die deutsche Softwarefirma aexea, deren Software laut eigenen Angaben mittlerweile elf Sprachen beherrscht – darunter auch Mandarin. Das Unternehmen aus Stuttgart hat seine Wurzeln in der Werbebranche und dort liegen auch die Ursprünge ihrer Schreibmaschinen: Die wurden entwickelt, um zum Beispiel automatisiert die Beschreibung für Kataloge von Ferienwohnungen in mehreren Sprachen für Onlineangebote zu erzeugen. Statt schnöder tabellarischer Angaben können die potentiellen Kunden halbwegs abwechslungsreiche Beschreibungstexte lesen. Und nicht nur die: Auch Suchmaschinen wie Google begünstigen individuell beschriebene Produkte, wenn es um eine gute Platzierung in den Suchergebnissen geht.

Voraussetzung für diese Automatisierung ist derzeit, dass die zugrundeliegenden Informationen strukturiert vorliegen (z.B. in einer Tabelle) und damit maschinenlesbar sind. Und dass es klare Regeln gibt, wie ein Ergebnis oder Vorgang zu bewerten ist. Das ist der Grund, warum sich Sportberichte so gut für Roboterjournalismus eignen. Immer mehr wird dort gezählt – z.B. Laufwege in Metern oder die Anzahl erfolgreicher Pässe. Zudem gibt es ein klares Regelwerk. Wenn dies in eine Logik überführt werden kann, in der die Software gut und schlecht, richtig und falsch bewerten kann, lässt sich daraus ein Text erzeugen. Die Software bedient sich dabei dem einprogrammierten Wissen über Grammatik und Rechtschreibung und bei einer Phrasendatenbank, um variantenreiche Texte zu verfassen. An solch semantischer Software, an „natural language“-Verfahren, wird seit Jahrzehnten geforscht. Dabei geht es um Programme, die Sinnzusammenhänge „verstehen“ und wiedergeben können. Also um Software, die mit Hilfe von Datenbanken nicht nur weiß, dass die Eiche ein Baum ist - sondern auch, dass diese Bäume oft in Wäldern zu finden sind und außer im Winter Blätter tragen.

Gespür für Nuancen

Bei natural language gibt es permanent Fortschritte; die Notwendigkeit, dass Fakten schon als Daten vorliegen, wird abnehmen – „künstliche Intelligenz“ wird in absehbarer Zeit nahezu fehlerlos relevante Informationen aus unstrukturierten Quellen entnehmen können: Aus Texten, Fotos, Film- und Tonaufnahmen. Dennoch wird es weiterhin diverse Bereiche geben, in denen Automaten Journalisten und andere Autoren nicht ersetzen werden: Im Feuilleton wird so schnell keine Theaterkritik zu lesen sein, die automatisch generiert wurde. Dort, wo Empathie, Humor und ein Gespür für Nuancen verlangt wird - wo Vorgänge sich kaum in Zahlen fassen und ausdrücken lassen - dürfte noch lange der Mensch die Oberhand bewahren. So dürfte auch so bald kein von Roboterhand geschriebener Roman die Bestsellerlisten erobern.

Mittel- und langfristig ist aber vorstellbar, dass eine Software so gut die sprachlichen und thematischen Muster von Bestseller-Romanen analysieren kann, dass zumindest ein lesbares Imitat eines Romans herauskommen kann. Grundlage für so einen synthetischen Beststeller wären nicht zuletzt statistische Verfahren: Etwa Wortanzahl, Variation von Satzlängen, Positionen der Personennamen im Text. Zusätzlich würden die Bewertungen und Reaktionen bei Plattformen wie Amazon und Goodreads mit einer „sentiment analysis“ ausgewertet. Solch einen Roman könnte es auch als Hörbuch geben. Denn die Qualität von automatisch generierter Sprache, von Sprachsynthese, wird ebenfalls immer besser: Roboterjournalismus wird es auch im Radio geben.

Mensch oder Maschine?

Im Jahr 2020, so meint Alexander Siebert, wird man nicht mehr unterscheiden können, ob ein Text von einem Menschen oder einer Maschine geschrieben wurde. Siebert ist der Gründer von Retresco; sie ist die andere deutsche Firma in diesem Spezialgebiet. Beheimatet in Berlin bietet sie eine „Textengine“ an, die mittlerweile für das Fußballportal „FussiFreunde“ im Einsatz ist. Unternehmer Siebert sieht den großen Vorteil der Automatisierung darin, dass er eine hohe Individualisierung von Nachrichten erlaubt: Sie können exakt auf die Interessen eines Rezipienten zugeschnitten werden.

Einen deutlichen Schritt weiter in Sachen Prognose wagt Kristian Hammond, einer der Gründer von Narrative Science aus Chicago. Neben Automated Insights, ebenfalls aus den USA, gilt das Unternehmen als Referenz für Roboterjournalismus. Hammond meint, im Jahr 2030 würden 90 Prozent aller Nachrichten direkt von Computern erzeugt. Das sei aber kein Grund zur Sorge für Journalisten. Denn dabei ginge es um Berichte, für die es sich nie lohnen würde, menschliche Arbeitskraft aufzubringen.

Eins ist mit Sicherheit vorherzusagen: Im digitalen Zeitalter wird Software im Journalismus in Bälde mindestens den Rang eines Assistenten erlangen. Der seinen menschlichen Kollegen Texte vorbereitet und langweilige Recherchearbeiten übernimmt. Was die Automatisierung der Berichterstattung für den Arbeitsmarkt von Journalisten bedeutet, steht allerdings auf einem anderen Blatt geschrieben.