Lange hat es gedauert, aber heute werden die ersten Analysen des OpenSchufa-Datensatzes veröffentlicht. Die Redaktionen vom SpiegelOnline und dem Bayerischen Rundfunk haben die anonymisierten Daten, die wir mithilfe von OpenSchufa im Frühjahr gesammelt haben, ausgewertet. Herzlichen Dank an alle Personen, die uns für das Projekt Geld, Zeit und Daten gespendet haben!

Das sind die wichtigsten Erkenntnisse:

  • Schlechte Scores auch ohne Negativmerkmale

Viele Personen haben schlechte Schufa-Scores, obwohl sie keine negativen Merkmale haben. Im OpenSchufa-Datensatz finden sich mehr als 20 Verbraucherinnen und Verbraucher, denen die Schufa ein „erhöhtes Risiko“ bescheinigt, obwohl ihre Finanzhistorie nicht mehr als drei Einträge umfasst - ausschließlich positive. Das bedeutet: Offenbar ist der Schufa-Algorithmus fehleranfällig. Wenn auch Personen, die keine Schulden oder Zahlungsausfälle haben, schlechte Scores bekommen, ist das Scoring-Verfahren kaputt.

  • Angeblich genaue Scores trotz ungenauer Daten

Die Schufa-Scores suggerieren der Öffentlichkeit, dass sie besonders wissenschaftlich erstellt werden. Ein Teil dieses Bildes wird durch die angebliche Genauigkeit von Scores wie beispielsweise 85,04% oder 97,41% erzeugt. Die Angaben sind allerdings irreführend. Oft fehlt der Schufa die Datenbasis, um tatsächlich zuverlässige Aussagen über die Kreditwürdigkeit von einzelnen Personen treffen zu können. Über fast ein Viertel der Personen im OpenSchufa-Datensatz hat die Schufa maximal drei Informationen aus dem Wirtschaftsleben gespeichert. Statistische Fehlerbereiche fehlen in den Auskünften trotzdem. Der Score ist in diesen Fällen nicht besonders vertrauenswürdig.

  • Faktoren: Alter, Geschlecht und Umzüge

Der OpenSchufa-Datensatz legt nahe, dass Faktoren wie Alter, Geschlecht und viele Umzüge sich auf den Schufa-Score auswirken. Beispielsweise sind häufig junge Männer schlechtergestellt. Das bedeutet: Auch Aspekte, die nicht beeinflussbar sind, könnten negative Schufa-Scores hervorrufen. Mit den Daten lässt sich nicht abschließend sagen, wie genau die Faktoren auf den jeweiligen Score wirken und ob die Schufa diese einzeln in die Berechnung eingehen lässt oder sie kombiniert. Es könnte sein, dass die Scores diskriminieren.

  • Manche Scores sind aus der Zeit gefallen

In vielen Bereichen hält die Schufa aus einem Scoring-Bereich mehrere Score-Versionen über Einzelpersonen. Das führt dazu, dass Personen beispielsweise nach der Version 1 des Schufa-Bankenscores einen schlechteren Score haben als nach Version 2 oder Version 3 des Schufa-Bankenscores. Wer Pech hat, dass eine Bank eine ältere Score-Version von der Schufa anfordert, hat in einem solchen Beispiel schlechtere Karten. Dass die älteren Score-Versionen noch herausgegeben werden, führt offenbar zu Verzerrungen.

Daraus ergeben sich diese Forderungen:

Dank OpenSchufa hat sich bereits der Sachverständigenrat für Verbraucherfragen (SVRV) beim Bundesministerium für Justiz und Verbraucherschutz mit Scoring-Transparenz beschäftigt.

Er hat sich dafür ausgesprochen, dass die Schufa und weitere Scoring-Anbieter ihren Algorithmus offenlegen. Merkmale und Gewichtung des Scores müssen für den Verbraucher verständlich werden. Wie auch die Ergebnisse von OpenSchufa zeigen, muss mögliche Diskriminierung geprüft und offengelegt werden. Ein zentrales Problem bei der Schufa ist offenbar die Qualität des Scores und der ihr zugrunde liegenden Daten.

Weitere Berichterstattung des Bayerischen Rundfunks hat bereits gezeigt, dass die Aufsicht der Schufa und anderer Scoring-Anbieter mangelhaft ist. Die Schufa bezahlt selbst für die Gutachten, die sie eigentlich unabhängig prüfen sollen.

Das Bundesministerium hat bereits angekündigt, die Empfehlungen des Rats zu prüfen. Die Schufa sollte neben Transparenz auch ihre Verantwortung in der Gesellschaft akzeptieren. Dazu gehört, dass die Schufa mit Forschern, Journalistinnen und der Zivilgesellschaft konstruktiv kooperieren sollte. Bisher ist die Pressestelle der Schufa vor allem dadurch aufgefallen, dass sie Journalistinnen einschüchtert.

Und was ist mit dem Schufa-Algorithmus?

Wir arbeiten derzeit noch daran, verschiedene Aspekte der Schufa-Formel zuverlässig zu entschlüsseln. Die Herausforderung: Von rund 30.000 Anfragen, die Nutzer über selbstauskunft.net an die Schufa gestellt haben, sind an uns nur rund 3.000 Datensätze weitergeleitet worden, die vor allem aus bestimmten gesellschaftlichen Milieus stammen. Wir versuchen trotzdem, weitere möglichst sichere Aussagen über den Schufa-Algorithmus zu treffen und arbeiten dafür weiter mit dem Datensatz.

Ursprünglich hatten wir geplant, bei Verzerrungen in den Daten gezielte Aufrufe an bestimmte Bevölkerungsschichten zu richten, um von ihnen Daten zu erhalten. Das ist derzeit aber nicht mehr möglich. Seit Anwendung der Datenschutzgrundverordnung (DSGVO) im Mai gibt die Schufa mit der kostenlosen Selbstauskunft deutlich weniger Daten also vorher an Einzelpersonen. Datenspenden von Schufa-Auskünften sind also seit Mai für uns nicht verwendbar. Hier muss sich die Schufa bewegen.

Wie geht es weiter?

Wir arbeiten gemeinsam mit unserem Partner AlgorithmWatch weiter an der Auswertung der Daten und hoffen, bald noch weitere Erkenntnisse aus den Daten ableiten zu können. Daran anschließend wollen wir weitere Empfehlungen für gesetzliche Regelungen geben. Wichtig außerdem: Derzeit weigert sich die Schufa noch, kostenlose Auskünfte auch per E-Mail herausgeben, obwohl sie es müsste. Wir werden uns dafür einsetzen, dass die Schufa dieser Verpflichtung aus der DSGVO nachkommt.

Die Schufa ist der Anfang, aber nicht das Ende. Wir brauchen mehr Transparenz für alle Scoring-Anbieter in Deutschland und Europa.

Zur aktuellen Schufa-Berichterstattung

Politische Reaktionen

Pressekontakt

Arne Semsrott, Open Knowledge Foundation Deutschland, arne.semsrott@okfn.de, 030 57703666 0