In eigener Sache

Warum KURTs Corona-Grafik hin und wieder falsche Daten angezeigt hat - und was wir als nächstes planen

Ben Weber Veröffentlicht am 22.11.2020
Warum KURTs Corona-Grafik hin und wieder falsche Daten angezeigt hat - und was wir als nächstes planen

Leider stimmten die Daten in KURTs Corona-Grafik nicht immer. Der dahinter stehende Algorithmus ist bei den immer wieder wechselnden Formatierungen der Pressemitteilungen, die von Gifhorns Kreisverwaltung online gestellt werden, an seine Grenzen gestoßen. Dieses Problem wurde behoben – doch die nächste Herausforderung wartet schon.

Foto: Pixabay (Symbolfoto)/KURT-Bildmontage

Tausende Infizierte, hunderte Verstorbene? Das kann doch nicht sein – einen Tag vorher sah doch alles noch ganz harmlos aus. Und sobald der Fehler der KURT-Redaktion aufgefallen war, wurde er schon wieder behoben. Dem einen oder anderen aufmerksamen Gast unserer Website wird sicherlich die hübsche Infografik mit den aktuellen Corona-Zahlen im Landkreis Gifhorn auf der Startseite aufgefallen sein. Warum diese Grafik aber manchmal sehr seltsame Zahlen angezeigt hat, erklärt KURTs Web-Entwickler Ben Weber in diesem Beitrag. Außerdem gibt er noch einen Blick hinter die Kulissen – und einen Ausblick auf eine noch viel bessere Darstellung der Corona-Zahlen.

Die Idee hinter der Corona-Grafik ist simpel: Eine Übersicht über die aktuelle Corona-Lage innerhalb Sekunden vermitteln und zusätzlich den infektiösen Verlauf im Landkreis mit einem Diagramm darstellen. Die praktische Umsetzung ist wie so oft nicht ganz so simpel. Denn irgendwo müssen die Daten natürlich herkommen.

Viele Redaktionen würden diese Zahlen wahrscheinlich einfach per Hand übertragen – das wäre aber viel zu langweilig für KURT. Und außerdem würde die Grafik dann nicht so schön aktuell sein, da sich das Ganze durch die manuelle Bearbeitung von Menschen verzögern würden.

Der coole Weg

Viel cooler wäre es doch, wenn alles komplett automatisch passieren würde. Von der Beschaffung der Daten, der Archivierung, bis hin zur Generierung der Grafik. Genau dabei kommen sehr schöne Algorithmen ins Spiel, die genau das alleine erledigen können. Genauer gesagt sprechen wir hier über den Bereich des „Web-Scrapings“.

Ganz plastisch: Stellt Euch einen (virtuellen) Roboter vor, der den Browser öffnet, auf die Seite des Landkreises Gifhorn geht, dort die neueste Pressemitteilung findet, in dieser nach den relevanten Zahlen Ausschau hält und sich diese dann einfach stibitzt. Und dreimal dürft Ihr raten, was wir haben… genau: solch tolle Algorithmen!

Warum da manchmal trotzdem Schmarrn stand…

An sich ist so was eine bombensichere Sache. Einmal schnell programmiert, auf ein Intervall von 10 Minuten gesetzt und fertig. Das einzige Problem dabei ist aber mal wieder: der Mensch.

Denn leider werden die Daten vom Landkreis Gifhorn nicht in Form praktikabler Tabellen oder einer API (eine Programmierschnittstelle) bereitgestellt, sondern immer in reiner Textform in den Pressemitteilungen dargestellt.

Und die Mitarbeiter*innen der Kreisverwaltung machen einen extrem guten Job darin, die Pressemitteilung immer ein bisschen anders zu formatieren. Mal wird eine Liste verwendet, dann mal wieder nur Sonderzeichen als Punkte, mal neue Zahlen dazu, mal Zahlen weg, mal Zahlen umsortieren, mal ein Sonderzeichen anstelle eines Leerzeichens, mal ein Absatz mehr, mal gar kein Absatz und so weiter…

Nun ja, und so etwas kann halt einen Roboter, der feste Anweisungen hat, wo er welche Daten zu finden hat, schon mal ganz schön durcheinander bringen. Und letztlich kann es dann dazu führen, dass der Roboter mal die falschen Daten ausliest – und natürlich direkt in die Grafik überträgt.

So kam es ein paar mal in den vergangenen Wochen zu sehr seltsamen (und teils auch sehr beängstigenden) Zahlen, die unsere Redaktion zwar stets zeitnah manuell korrigiert hat – wofür wir uns aber dennoch selbstverständlich entschuldigen möchten.

Wie wir das Problem gelöst haben

Die Lösung für das Problem ist letztlich ein kleiner Zwischenschritt. Sobald der Roboter nämlich seiner Meinung nach richtige und neue Zahlen ausgelesen hat, meldet er sich stolz bei der Redaktion per Mail und fragt höflich, ob die Daten denn auch stimmen.

Erst dann, wenn die Redaktion das per Mausklick bestätigt, werden diese Daten dann auch in die Grafik übertragen.

So kommt die Grafik zwar wieder mit ein wenig Verzögerung, da auf langsame Menschen gewartet werden muss (oder auch mal ein bisschen mehr, da ja nicht rund um die Uhr jemand am Rechner sitzt); dafür sind die Zahlen dann aber auch wirklich korrekt.

Das nächste Problem

Nachdem wir unsere Programmierung nun also so umgestellt haben, stellt uns die Entscheidung der Gifhorner Kreisverwaltung vor ein erneutes Problem: Kurzfristig hat man sich dort nämlich dafür entschieden, jetzt nur noch die Zahlen mitzuteilen, die auch das Landesgesundheitsamt veröffentlicht – weil es in der Vergangenheit immer wieder zu Verwirrung und teils heftigen Social-Media-Diskussionen führte, worum zwei Behörden teils völlig verschiedene Zahlen veröffentlichten.

Neben der Zahl der Getesteten und all jener, die positiv getestet wurden, wir nun auch weiterhin die aktuelle Zahl der Verstorbenen vermeldet. Allerdings wird die Zahl der bereits genesenen Personen nicht mehr mitgeteilt – diese wiederum hat unser Algorithmus stets verwendet, um die Zahl der aktuell Infizierten zu berechnen. Und das kann der Roboter jetzt leider nicht mehr.

Stattdessen wird von der Gifhorner Kreisverwaltung zurzeit nur die Anzahl derjenigen mitgeteilt, die in den zurückliegenden 7 Tagen positiv getestet wurden – was natürlich maßgeblich für den zurzeit alles entscheidenden 7-Tage-Inzidenzwert ist.

Die Zahl der aktuell Infizierten bleibt so aber im Nebel – und unsere hübsche Corona-Grafik lässt sich so seit dem 18. November, dem Tag, an dem zuletzt die Zahl der Genesenen mitgeteilt wurde, nicht mehr aktualisieren.

Was wir jetzt geplant haben

Die Corona-Grafik ist noch lange nicht in ihrem Endstadium. Aktuell arbeiten wir an einer neuen, viel besseren Version – und das taten wir auch schon, bevor die Gifhorner Kreisverwaltung sich dafür entschieden hat, die Zahl der Genesenen nicht mehr zu vermelden.

Die neue Corona-Grafik wird dann als eigene Website aufrufbar und interaktiv sein, alle wichtigen Daten und Diagramme enthalten, über Regelungen informieren und vieles mehr.

Die Daten sollen aus vielen verschiedenen Quellen ausgelesen und übersichtlich zusammengetragen werden – so dass nur noch eine Anlaufstelle nötig ist, um perfekt informiert zu werden. Wie zuverlässig die Daten darin stimmen, hängt jedoch auch dann von den jeweiligen Quellen ab...


Coole Leute gesucht – wir stellen ein!

Informiere Dich über Jobs in unserem Medienhaus! Wir sind auf der Suche nach tollen Menschen, die bei uns einsteigen möchten.

Mehr erfahren