Zum Hauptinhalt springen

Falsch positive Chatkontrolle

Seit Mitte Mai werden die Pläne der EU zur anlasslosen Durchsuchung von Mail- und Messenger-Inhalten heiß diskutiert. Die Unstatistik des Monats Juni beschäftigt sich mit der Behandlung des Gesetzentwurfs durch die Medien und die Bundesregierung. Sie zeigt, welche statistischen Tücken solche auf Algorithmen basierenden Kontrollen haben können.

Einerseits wurden die mit dem Gesetz verbundenen Eingriffe in die Privatsphäre der Nutzer und die statistischen Probleme durchaus abgewogen: „Laut EU sollen die Provider Scan-Methoden verwenden, die nach dem Stand der Technik in der Branche den geringsten Eingriff in die Privatsphäre darstellen – auch um Fehlalarme so weit wie möglich [zu] begrenzen“, schreibt der Deutschlandfunk. Andererseits haben mehr als 70 Grundrechtsorganisationen dennoch – und aus statistischer Sicht zu Recht – gegen das Gesetz protestiert und u.a. eine Petition dagegen gestartet. Auch Volker Wissing, Minister für Digitales und Verkehr, will laut FAZ „mit allen Argumenten dagegen vorgehen“. Inzwischen hat die Bundesregierung einen Katalog mit 61 kritischen Fragen an die EU-Kommission geschickt, der auf dem Portal Netzpolitik.org veröffentlicht wurde.

Die hier interessierende Frage Nr. 7 des Katalogs beschäftigt sich mit der Problematik der möglichen falsch positiven Treffer: „Wie ausgereift sind die modernen Technologien zur Vermeidung falsch positiver Treffer? Welcher Anteil an falsch-positiven Treffern ist zu erwarten, wenn Technologien zum Nachweis von Grooming eingesetzt werden? Hält es die COM [Kommission] zur Verringerung der falsch-positiven Treffer für notwendig, vorzuschreiben, dass Treffer nur dann veröffentlicht werden, wenn die Methode bestimmte Parameter erfüllt (z.B. eine Trefferwahrscheinlichkeit von 99,9%, dass der betreffende Inhalt angemessen ist)?“

Diese Frage legt die Vermutung nahe, dass trotz aller Debatten um falsch positive Corona-Tests immer noch sehr wenige politische Entscheidungsträger und Medienvertreter die Brisanz dieses Problems erkannt haben. Denn bei einer schier unvorstellbaren Zahl an täglich verschickten Nachrichten, von denen lediglich ein (glücklicherweise) sehr kleiner Anteil missbräuchliche Inhalte enthält, führt selbst ein exzellenter Algorithmus zu einer sehr großen Zahl an Fehlalarmen.

Allein auf WhatsApp und allein in Deutschland werden pro Tag rund 3 Milliarden Nachrichten verschickt (siehe Beiträge von Chip.de und Messengerpeople.com). Angenommen, nur 0,0001 Prozent, also insgesamt 3.000 aller dieser Nachrichten, enthalten unangemessene Inhalte. Dann werden 99,9 Prozent davon oder 2.997 Nachrichten entdeckt. Zugleich werden jedoch von den nach wie vor fast 3 Milliarden „unschuldigen“ Nachrichten 0,1 Prozent, also fast 3 Millionen Nachrichten, als unangemessen fehlklassifiziert. Die wären dann mit einem weiteren Algorithmus oder schlimmstenfalls von Menschen erneut zu prüfen. Und das jeden Tag.

Selbst mit einer viel besseren Methode, die 99,999 Prozent aller Nachrichten korrekt als „angemessen“ oder „unangemessen“ erkennt, kommen auf jede richtigerweise als unangemessen erkannte Nachricht zehn Nachrichten, die vom Algorithmus zu Unrecht als unangemessen deklariert werden.

Nun könnte man einwenden, dass Algorithmen nicht nur einzelne Nachrichten klassifizieren, sondern ganze Chatverläufe. Das verschiebt aber lediglich das Problem. Denn im Zweifelsfall müssen zwar weniger, aber dafür umso längere Nachrichtenverläufe zusätzlich geprüft werden. Das Risiko, dass ein von einer KI-Anwendung verdächtigter Nutzer zu Unrecht ins Visier gerät, bleibt auf jeden Fall unzumutbar hoch.

Und das ist es, was die Chatkontrolle für beide Seiten unverhältnismäßig macht. Für den Bürger, der selbst beim Einsatz moderner Technologien mit hoher Wahrscheinlichkeit unschuldig ist, wenn er verdächtigt wird. Und für Behörden, die dann kaum noch etwas anderes zu tun haben, als zu Unrecht Verdächtigte wieder zu entlasten. Wenn Minister Wissing und der Rest der Bundesregierung es ernst meinen damit, alle Argumente auf den Tisch zu bringen, dann sollte dieses Argument auf dem Silbertablett serviert werden.

Anm. d. Red.:
Gegenüber der ersten Fassung der Pressemitteilung ist eine Korrektur eingefügt, zudem hat uns ein Hinweis der Europäischen Kommission erreicht:

Im ersten Absatz hieß es: "Der Gesetzentwurf wie auch seine Behandlung durch die Medien und die Bundesregierung sind unsere Unstatistik des Monats Juni. Denn schon allein aus statistischen Gründen schlägt die EU mit der angestrebten Chatkontrolle einen Irrweg ein.“ Tatsächlich ist der Gesetzentwurf selbst jedoch nicht Gegenstand der Unstatistik, daher haben wir die Formulierung entsprechend angepasst auf  „Die Unstatistik des Monats Juni beschäftigt sich mit der Behandlung des Gesetzentwurfs durch die Medien und die Bundesregierung. Sie zeigt, welche statistischen Tücken solche auf Algorithmen basierenden Kontrollen haben können.“
Die Europäische Kommission hat uns gebeten, explizit darauf hinzuweisen, dass die in diesem Unstatistik-Text verwendeten Zahlenbeispiele nicht auf Angaben der Europäischen Kommission beruhen. Nach den Berechnungen, die den Angaben der Europäischen Kommission zugrunde liegen, wären bei einer Fehlerwahrscheinlichkeit von 0,1 Prozent und bei 3000 vorab als potenziell kritisch geflaggten Bildern insgesamt 3 falsch positive Bilder zu erwarten. Zudem gehe der Kommissionsvorschlag auch nicht von einer „anlasslosen Kontrolle“ aus, sondern versuche, von einer flächendeckenden Bildersuche zu einer gezielten überzuleiten, die nur dann überhaupt in Erwägung gezogen werden soll, wenn andere Mittel scheitern.

Ihre Ansprechpartnerinnen dazu:
Katharina Schüller (STAT-UP), Tel.: (089) 34077-447
Sabine Weiler (Kommunikation RWI), Tel.: (0201) 8149-213, sabine.weiler@rwi-essen.de

Mit der „Unstatistik des Monats“ hinterfragen der Berliner Psychologe Gerd Gigerenzer, der Dortmunder Statistiker Walter Krämer, die STAT-UP-Gründerin Katharina Schüller und RWI-Vizepräsident Thomas K. Bauer jeden Monat sowohl jüngst publizierte Zahlen als auch deren Interpretationen. Alle „Unstatistiken“ finden Sie im Internet unter www.unstatistik.de und unter dem Twitter-Account @unstatistik. Unstatistik-Autorin Katharina Schüller ist zudem Mit-Initiatorin der „Data Literacy Charta“, die sich für eine umfassende Vermittlung von Datenkompetenzen einsetzt. Die Charta ist unter www.data-literacy-charta.de abrufbar.

Bei Weiterverbreitung von Texten aus der Reihe "Unstatistik des Monats" muss klar erkennbar sein, dass es sich um die Übernahme eines fremden Textes handelt. Zudem ist die Quelle https://www.unstatistik.de zu nennen. Bitte informieren Sie die Pressestelle des RWI über die Verwendung des Textes unter presse@rwi-essen.de. Das Urheberrecht bleibt bestehen.