Die ETH und der Weltfussballverband Fifa forschen an einem günstigeren Videoanalyse-System mit nur einer Kamera. Damit würden Nerven von Spielern und Publikum geschont.
Manchmal dauert es Sekunden, manchmal Minuten. Dann warten Fussballer und Publikum auf die Entscheidung des Schiedsrichters. Penalty oder nicht? Tor oder Abseits? Foul oder Ball gespielt? Es ist nervtötend.
Seit 2017 steht den Schiedsrichtern ein Videoassistent (VAR) zur Verfügung. Dass der Entscheid in manchen Fällen erst nach einer gefühlten Ewigkeit feststeht, ist dem umständlichen Überprüfungsverfahren geschuldet. Liegt ein möglicher Fehlentscheid vor, meldet sich der VAR. Er schaut sich im Videoraum die Bilder der Szene an. So stellt er Fouls oder Hands fest. Und Offsides erkennt er dank der 3-D-Visualisierung, die der Computer mittels künstlicher Intelligenz (KI) aus den Kamerabildern generiert.
Den endgültigen Entscheid trifft aber immer der Schiedsrichter auf dem Platz – nach Konsultation des VAR oder dem Blick auf den Monitor am Spielfeldrand. Doch je stärker sich die KI weiterentwickelt, desto mehr drängt sich die Frage auf: Braucht es den Schiedsrichter überhaupt noch?
Kritiker bemängeln die heutige VAR-Praxis
Dank dem Videobeweis wurden eindeutige Fehlentscheide seltener, doch die gängige VAR-Praxis hat Schwächen. Kritiker bemängeln lange Spielunterbrechungen und die hohen Kosten der VAR-Technologie. In den meisten Kleinstadien fehlen die zehn bis sechzehn Kameras, die es dazu braucht. Und nicht jede Liga hat ein Budget für die zusätzlichen Leute im Videoraum. Deshalb werden einige Partien weiterhin ohne VAR ausgetragen. Etwa solche im Schweizer Cup, die im Stadion des unterklassigen Vereins stattfinden.
Der Weltfussballverband (Fifa) hat das Problem erkannt. Seit vier Jahren unterstützt er deshalb ein Forschungsprojekt der ETH Zürich. In diesem arbeiten Forschende daran, eine einfachere und günstigere VAR-Technologie zu entwickeln. Die Idee ist simpel, die Umsetzung schwierig.
Das Ziel? Ein Videoanalyse-System, so präzise wie das heutige, aber nur mit einer einzigen Kamera. Manuel Kaufmann, Forscher an der ETH, sagt: «Die Technologie könnte dereinst direkt in die TV-Kamera integriert werden, die ohnehin jedes Spiel filmt.» Diese Kamera steht auf der Höhe der Mittellinie und ist Standard bei Live-Übertragungen. Weniger Geräte, weniger Menschen, weniger Kosten – so die Vision.
Doch wie soll das funktionieren, eine VAR-Technologie, die mit nur einer Kamera auskommt?
Posenschätzung durch maschinelles Lernen
Aus Videoaufnahmen der Weltmeisterschaft 2022 generierten die Forschenden zunächst Millionen 3-D-Positionen. Der sogenannte World-Pose-Datensatz zeigt, wo sich die Fussballer und der Ball in einer Vielzahl von Spielsituationen befinden und wie sie sich bewegen – Posenschätzung heisst das im Fachjargon.
Die Posenschätzung mit mehreren Kameras ist schon heute sehr präzise. Im Tennis etwa zeigt das Hawk-Eye-System, ob der Ball auf oder neben der Linie gelandet ist. Der Fussball erschwert die Posenschätzung allerdings, weil es hier zu vielen Verdeckungen kommt: Ein Körperteil ist hinter einem anderen, der Ball hinter einem Fussballer verborgen.
Der Computer nimmt die Posenschätzung anhand von Daten vor. Und diese Daten mussten die ETH-Forschenden zuerst ermitteln. Aus den Bildsequenzen der WM 2022 erhoben sie Referenzdaten mit Tiefeninformationen – also Daten, die genau zeigen, wo auf dem Spielfeld sich die Spieler und der Ball befinden. Diese Referenzdaten speisten die Forschenden dann in Deep-Learning-Programme ein. Mit solchen KI-Verfahren lernt der Computer, die Daten selbst zu interpretieren und Positionen zu berechnen. Also selbst auf Abseits oder Tor zu entscheiden.
Die ETH-Forschenden haben mittlerweile einen Algorithmus entwickelt, der die Posenschätzung aus dem Bild einer einzigen Kamera vornimmt. Was fehlt, ist die Genauigkeit, «etwa wenn Spieler sich verdecken oder kreuzen oder die Kamera Zoom-Bewegungen ausführt», sagt Manuel Kaufmann von der ETH.
Um die Entwicklung der VAR-Technologie zu beschleunigen, lancierte die Fifa vor kurzem einen Innovationswettbewerb. Dazu stellte sie den World-Pose-Datensatz Wissenschaftern aus der ganzen Welt zur Verfügung. Diese sollen ihre Computer nun mit dem Datensatz der ETH trainieren und bessere Algorithmen kreieren, damit eine genaue KI-Analyse des Spielgeschehens mit einer einzigen Kamera schon bald möglich ist.
Bis diese neue, einfachere VAR-Technologie einsatzbereit ist, wird es laut Kaufmann noch einige Jahre dauern. Der Computerwissenschafter erwartet aber, dass die Algorithmen dank dem Wettbewerb schnell besser werden. In den vergangenen Jahren habe es schliesslich auch in anderen KI-Bereichen rasante Entwicklungen gegeben, etwa bei Chat-GPT. Kaufmann sagt: «Wann die neue VAR-Technologie tatsächlich zum Einsatz kommt, hängt davon ab, welche Genauigkeit die Fifa und die Schiedsrichter als Qualitätslevel akzeptieren.»
Klar ist: Der zunehmende Einsatz von KI wird die Arbeit des Schiedsrichterteams verändern. Denn eine VAR-Technologie, die sämtliche Spielerpositionen und Bewegungen des Balls berechnen kann, könnte dereinst fast alle Entscheidungen selbständig fällen: Erkennt die KI ein Abseits, erklingt im Headset des Schiedsrichters ein Signalton. Das Gleiche könnte bei Eckbällen, Einwürfen und allen anderen Spielsituationen geschehen, die räumlich berechenbar sind. Höchstens bei Fouls wäre die Interpretation der Bilder durch einen Schiedsrichter dann noch nötig. Die Leute im Videoraum wären somit weitgehend überflüssig.
Der frühere Schweizer Spitzenschiedsrichter Urs Meier sagt, auch die Rolle des Referees auf dem Platz werde sich stark wandeln: «Der Spielleiter ist schon heute nicht mehr die absolute, letzte Instanz. Und auch die Regeln passen sich immer stärker der Technik an.» Der 66-Jährige sieht die fortschreitende technologische Entwicklung im Fussball allerdings durchaus kritisch. Denn sie untergrabe zunehmend die Autorität des Spielleiters. Meier sagt: «Wegen des Vertrauens in die Technik fehlt den Schiedsrichtern immer öfter der Fussballsachverstand, das Fingerspitzengefühl für Spielsituationen. Anstatt die Schiedsrichter entsprechend zu schulen, investieren die Regelhüter immer stärker in die Technologie.» Solange die KI Spielsituationen jedoch nicht «verstehen» könne, werde es weiterhin einen kompetenten Spielleiter auf dem Platz benötigen, der souverän mit den Spielern und Trainern kommuniziere.
Meier sagt, die Einführung des VAR habe eher zu einer Verschiebung der Regelprobleme geführt, gelöst worden seien sie nicht: «Mittlerweile beschweren sich die Leute zwar weniger über den Schiedsrichter, dafür umso stärker über den VAR. Der Videoassistent ist aber auch ein Mensch. Und heute gibt es eher noch mehr Diskussionen als früher.»
Der Schiedsrichter kann sich künftig stärker auf die Kommunikation konzentrieren
Wird der Fussball dank dem zunehmenden Einsatz von KI also gar nicht fairer, wie es die neue VAR-Technologie verspricht? Manuel Kaufmann von der ETH sagt: «Auch ein Algorithmus kann Fehler machen, je nachdem, wie und mit welchem Datensatz er trainiert wurde. Aber seine Fehler sind systematisch. Ein gleicher Input führt immer zur gleichen Entscheidung.» Beim Schiedsrichter auf dem Platz und beim VAR ist das hingegen nicht garantiert.
Unstrittig ist jedenfalls: KI erhöht die Transparenz. Spieler und Zuschauer akzeptieren Entscheide eher, wenn sie diese nachvollziehen können. Ein Pilotprojekt in der Bundesliga während der laufenden Saison zeigt, dass auch die Erklärungen der Referees nach Videobeweisen im Stadion gut ankommen. Noch fehlen auf den Video-Screens allerdings die Bildsequenzen, auf deren Grundlage der Entscheid getroffen wurde.
Eine VAR-Technologie mit nur einer Kamera hat also viele Vorteile: Die Schiedsrichterentscheide werden systematischer, nachvollziehbarer – und schneller. Die Kosten für Klubs und Ligen sinken, da weniger Kameras und weniger Personal nötig sind. Und was passiert mit dem Spielleiter auf dem Platz? Seine Kernkompetenz wird künftig weniger in der regeltechnischen Entscheidungsfindung liegen. Und dafür stärker in der kommunikativen Vermittlung dieser Entscheide an Spieler und Publikum.
Bis der Schiedsrichter nur noch die Entscheide der KI kommuniziert, dürfte es aber noch eine Weile dauern.