KI im Sport
Wie Daten den Fußball verändern

Radim Ševčík widmet sich auf seinem Blog Torparameter (Gólové parametry) seit 2012 der Sportanalyse. Foto: © Radim Ševčík

Der Verteidiger Michael Ngadeu-Ngadjui war der erste Transfer, den der Fußballverein Slavia Prag auf Grundlage einer Datenanalyse tätigte. Drei Jahre später wechselte Ngadeu nach Belgien für das zehnfache der Ablösesumme, die Slavia für ihn bezahlt hatte. Die Arbeit mit Daten setzt sich auch im tschechischen Fußball durch und beginnt, ihn zu verändern.
 

Der Verein Viktoria Pilsen versucht an seine großartigen Leistungen von vor einigen Jahren anzuknüpfen. Wie hat Viktoria sich in der Spielzeit 2018/2019 geschlagen, als der Klub zum letzten Mal tschechischer Meister wurde? Statt Tabellen durchzugehen, reicht es, sich einen Graphen anzuschauen, den Radim Ševčík auf seinem Blog Torparameter (Gólové parametry) anbietet. In den Grafiken, den so genannten worm charts, ist übersichtlich der herausragende Einstieg von Viktoria Pilsen in die Saison zu sehen, dann der schwächere Frühling und schließlich die Sorgen, ob der erste Tabellenplatz gehalten werden kann. Ähnliche Visualisierungen kann man sich auch für andere Vereine anzeigen zeigen. Auch ein Überblick, wie sich die Punkteausbeute der tschechischen Vereine im Saisonverlauf entwickelt hat, steht für neun Spielzeiten von 2010 bis 2019 zur Verfügung.
 
Der Sportanalyse widmet sich der Blog Torparameter seit 2012 (wenngleich neue Beiträge seit geraumer Zeit auf sich warten lassen), als Radim an der Wirtschaftsuniversität Prag studierte.

Daten sind Gold

Daten sind wertvolle Güter, die Analytikunternehmen und Vereine für sich behalten wollen. Kameras sammeln Informationen über Zweikämpfe oder abgefangene Pässe, die Bewegung und weitere biometrische Werte überwachen Spezialwesten mit einem Chip (sie sehen aus wie Sport-BHs, in Tschechien wurden sie im vergangenen Jahr zum ersten Mal überhaupt von Sparta Prag eingesetzt). All das verarbeiten Computer. Der Zugang zu den Daten ist für die Fans deshalb nicht wirklich einfach. Schon bei den ersten Analysen stellte Radim schnell fest, dass es ein großes Problem ist, an öffentliche Daten für die tschechischen Ligen zu kommen. Zumeist setzte er deshalb Computerprogramme ein, die die Daten aus allgemein zugänglichen Quellen bezogen, wie etwa die Webseite der höchsten Fußballliga, Wikipedia, die Webseite eurofotbal.cz und weitere.
 
Zur Vorstellung, wie schwer es sein kann, relevante Daten zu bekommen: Am Anfang des erwähnten Überblicks über die Entwicklung der Punktgewinne in der tschechischen Liga stand das Hören von Podcasts über die Programmiersprache R, in denen über Youtube-Mitschnitte von Konferenzen gesprochen wurde. In einem solchen Mitschnitt wurde ein Datensatz zu Fußballstatistiken von 1871 bis 2016 erwähnt. Bei der Suche nach dem Datensatz stellte Radim allerdings fest, dass die Daten nicht mehr aktuell waren und sich nicht auf Tschechien bezogen. Radim war inspiriert, füllte die Lücken und ergänzte die Daten für die tschechische Liga. Die bot er dann öffentlich zum Download an. „Von Beginn an war für mich wichtig, alles zu veröffentlichen und auch anderen zu Verfügung zu stellen, inklusive der Daten und Codes“, erklärt der Fußball- und Statistikfan.

Wie hat Viktoria Pilsen sich in der Spielzeit 2018/2019 geschlagen, als der Klub zum letzten Mal tschechischer Meister wurde? Wie hat Viktoria Pilsen sich in der Spielzeit 2018/2019 geschlagen, als der Klub zum letzten Mal tschechischer Meister wurde? | © Gólové parametry

Bringt dem Computer bei, seinen Platz auf dem Spielfeld zu finden

In der letzten Zeit ist es laut Radim einfacher als früher, an strukturierte Daten heranzukommen und das ermöglicht auch mehr Innovation: „Die absolute Spitze, was die Arbeit mit Daten angeht, ist zum Beispiel Manchester City. Vor Kurzem hat mich ihr gemeinsames Projekt mit dem Unternehmen Google begeistert, in dem sie einen öffentlichen Wettbewerb zur Optimierung von Entscheidungsalgorithmen in einem Spiel auf der Webseite kaggle.com ausgeschrieben haben.“ Programmierer, die sich für Fußball interessieren, können Robotern beibringen, wie sie sich mehr wie echte Spieler verhalten können. Hinzuzufügen ist, dass es auch der Verein Manchester City war, der sich 2012 daran machte, die Fußballanalytik zu revolutionieren. Nach einer Vereinbarung mit seinem Datenlieferanten Opta Sports machte der Verein kostenlos den Datensatz der Spielzeit 2011/2012, der mehrere Zehntausend Pfund wert war, zugängig, um sich mit der Community von Analytikern gegenseitig zu bereichern.
 
Die Mehrzahl derer, die sich dem immer stärker werdendem Trend der Datennutzung im Sport widmet, hat vermutlich den Film Moneyball aus dem Jahr 2011 gesehen, der nach dem gleichnamigen Buch entstand. Der Protagonist Billy Beane (gespielt wurde er von Brad Pitt), Manager des Teams Oakland Athletics, das in der amerikanischen Major League Baseball spielt, begann im Jahr 2002 Neuzugänge anhand genauer Analyse von Computerdaten auszuwählen. Er hatte Erfolg. Das Zauberhafte daran war, dass er Spieler ins Team aufnahm, die bisher von den Scouts unterschätzt wurden, die Computeranalysen jedoch enthüllten ihre Qualitäten. Beans Methode übernahmen anschließend auch weitere Klubs. Ähnliche Ansätze finden sich auch im tschechischen Profifußball.

Datenbank mit einer Viertelmillion Spieler

Wissenschaftliche Methoden wendet beispielsweise auch Slavia Prag an. Der erste Transfer auf Grundlage einer Datenanalyse fand dort im Jahr 2016 statt, als man den kamerunischen Verteidiger Michael Ngadeu-Ngadjui aus Rumänien verpflichtete. „Ngadeu spielte sich schnell in die Stammelf als Sechser. Auf der neuen Position bestätigte er alle erwarteten Fähigkeiten –er verteidigte hervorragend die Räume, las das Spiel und hatte kein Problem in der physisch herausfordernden Liga. Ngadeu gewann in seiner ersten Spielzeit in Tschechien acht Kopfballduelle und 14 Zweikämpfe pro Spiel, einer der höchsten Werte in Tschechien“, heißt es auf der Webseite der tschechischen Firma 11Hacks, die Vereinen Scouting-Dienstleistungen, Spielanalysen und Implementierung analytischen Know-hows auf Grundlage einer Datenbank mit rund 250.000 Spielern anbietet.
 
Ngadeu gewann mit Slavia zwei Ligatitel, zweimal holte er den tschechischen Pokal, spielte in der Europa League und wurde 2019 zum besten Verteidiger der so genannten Fortuna Liga gekürt. Als er im gleichen Jahr nach Gent in Belgien wechselte, bekam Slavia für ihn die Ablöse von 115 Millionen Tschechischen Kronen (rund 4,3 Millionen Euro), fast das Zehnfache des Preises, für den Ngadeu verpflichtet worden war.
 
Selbstverständlich wäre es heikel, sich nur auf Zahlen zu verlassen. Der Beruf Talentscout stirbt sicherlich nicht aus, nur ist es nicht mehr nötig, die ganze Welt mit einem dichten Scouting-Netz zu überspannen. Und künstliche Intelligenz muss immer noch weiterentwickelt werden. Computer erkennen beispielsweise bei der Auswertung von Aufnahmen nicht ganz genau, was ein Spieler auf dem Spielfeld macht (führt er den Ball oder geht er in den Zweikampf?), um ihre Spielaktivitäten richtig einzuordnen.
 
Wenn vor einem Elfmeterschießen ein Assistent zum Torwart läuft, weist er ihn kurz ein, wohin der Gegenspieler am häufigsten schießt. Daten lassen sich beim Einstudieren von Standardsituationen anwenden, bei Einwürfen, bei der Raumdeckung und ähnlichem. Die Nachfrage nach einer solchen Verbesserung der Taktik wächst immer mehr.

Erfahren wir vorher, ob ein Tor fällt?

Ganz ohne Zweifel ändert sich der Fußball durch die Analyse von Daten. Das Spiel wird messbarer, der Druck auf die Effektivität steigt. Es entstehen auch neue Parameter, wie das „expected goal“, kurz xG, das auf einer Skala von Null bis Eins die Chancen bewertet und die Wahrscheinlichkeit dafür angibt, ob ein Tor fällt.
 
Die Worte der Filmfigur Billy Bean werden so Wirklichkeit: „Wenn die World Series ein anderes Team gewinnt – es sei ihm gegönnt. Sie werden Champagner trinken, einen Ring bekommen. Aber wenn wir gewinnen, mit unserem Budget, mit unserem Team, dann ändert das alles. Und darum geht es mir. Ich will, dass das etwas bedeutet.“
 
Einen bedeutenden Schub könnte die Nutzung künstlicher Intelligenz im konservativen (vor allem tschechischen) Fußball durch ein weiteres Zugänglichmachen der Daten bekommen. Vielleicht ist das der Weg, wie man das ganze Fach der Sportanalytik weiterbringen könnte. „Im Sammeln von Daten und ihrer Verfügbarkeit sehe ich noch immer große Reserven. Dennoch verbessert sich das, Rechenleistung wächst und wächst. Das Feld öffnet sich für Menschen, die früher keine Möglichkeit dazu hatten. Darin liegt ein großes Potential für die Zukunft“, glaubt Radim Ševčík. „Vor Kurzem hat mich eine Visualisierung der Trefferstatistik eines konkreten Spielers am Ball in der Live-Übertragung eines NBA-Spiels begeistert. Das könnte eine neue Anwendung der xG-Metrik für den Fußball sein“, deutet der Begründer des Projekts Torparameter an, was noch zu erwarten ist.

Das könnte auch von Interesse sein

Failed to retrieve recommended articles. Please try again.

Empfehlungen der Redaktion

Failed to retrieve articles. Please try again.

Meistgelesen

Failed to retrieve articles. Please try again.