Название: Kämpf um deine Daten
Автор: Max Schrems
Издательство: Bookwire
Жанр: Изобразительное искусство, фотография
isbn: 9783990011065
isbn:
Eines der Probleme dabei ist, dass diese Hochrechnungen und Verknüpfungen nur in der durchschnittlichen Masse stimmen, nicht in jedem Einzelfall. Ich habe zwar Recht studiert, würde mich aber nicht als konservativ bezeichnen. In meinem Bezirk gibt es auch Straßen, die eher nicht auf finanziell gute Bedingungen schließen lassen. Nicht alle in meiner Generation machen unbezahlte Praktika.
Die Unternehmen nehmen diese Ungenauigkeit in Kauf. Die Hochrechnungen stimmen eben bei ein paar Prozent nicht. Wenn ich aber bei 80% richtig liege, reicht das für eine Steigerung des Umsatzes oder die generell richtige Einschätzung der Kreditwürdigkeit schon aus. Wenn Sie zu den restlichen 20% gehören, ist das eben Ihr Problem. Sie müssen dann eben in einen reicheren Bezirk übersiedeln, damit alles wieder seine Richtigkeit hat. Nein, das ist kein Scherz. In einigen Ländern bringt das eine deutliche Veränderung in der Bewertung. Da sind 100 Euro mehr für die höhere Miete vielleicht ein gutes Investment.
Oft liegen diese Ungenauigkeiten auch daran, dass hier nicht logische Brücken und »Kausalitäten« berechnet werden (also zum Beispiel: wer Rechtswissenschaften studiert hat, verdient tendenziell mehr als jemand ohne Schulabschluss), sondern nur nach »Korrelationen« gesucht wird. Das bedeutet, man errechnet einfach nur, dass Faktor A mit Faktor B zusammenhängt, kümmert sich aber nicht mehr um die Frage, warum das so ist. Das ist natürlich viel einfacher und effektiver, als sich kompliziert zu überlegen, welche Zusammenhänge bestehen könnten.
So ist es auch vollkommen korrekt, wenn festgestellt wird, dass Schwarze in den USA ein höheres HIV-Risiko haben, Kinder von Migranten schlechter in der Schule sind und Frauen in gewissen Uni-Studien besser abschneiden. Das bedeutet aber nicht, dass alle Migranten doofer und alle Frauen intelligenter wären oder mehr Pigmente in der Haut HIV-Infektionen begünstigen. Für all diese Zusammenhänge gibt es irgendwelche, oft sehr komplexe Ursachen, also Kausalitäten im Hintergrund, die an hunderten Faktoren in unserer Gesellschaft liegen. Diese Kausalitäten werden bei der reinen Betrachtung von Korrelationen ausgeblendet.
Das ist natürlich kein unmittelbares Problem von Big Data. Wir Menschen tun das auch. Wir sind leider oft nicht in der Lage oder einfach zu faul, um die wahren Zusammenhänge zu erforschen und zu erkennen. Wir haben aber gleichzeitig einen inneren Drang, Zusammenhänge als Kausalitäten zu sehen und nicht als Korrelationen. Wir wollen einfache Erklärungen, auch wenn wir keine haben.
Was Menschen betrifft, sollten wir aber inzwischen wissen, dass Korrelationen nicht der Königsweg sind. Nicht alle Menschen einer Gruppe sind gleich, auch wenn vielleicht gewisse Faktoren mit der Zugehörigkeit zu einer Gruppe korrelieren. Diese Unterstellung, dass jemand »eh so wie alle anderen einer Gruppe« ist, nennen wir daher heute schlichtweg Diskriminierung. Wenn Sie einem Schwarzen sagen: »Du bist arm, weil viele Schwarze arm sind«, ist das für viele Menschen offensichtlich. Wenn Sie aber Frauen eine billigere Versicherung anbieten, weil die Gruppe »männlich« generell mehr Kosten verursacht, dann ist das schon weniger offensichtlich. Es ist aber nichts anderes: Weil viele Männer für eine Versicherung teurer sind, soll ich ebenfalls mehr zahlen. Wie komme ich aber dazu, nur weil meine Geschlechtsgenossen mehr Unfälle bauen oder eher ungesund leben, wenn ich das genaue Gegenteil bin? Das ist nichts anderes als eine geschlechtsbasierte Gruppenhaftung. Die EU unterband diese Form der Diskriminierung aufgrund eines X- oder Y-Chromosoms mit »Unisex-Versicherungen«. Eigentlich nur logisch, trotzdem eine große Diskussion und ein Dammbruch in vielen Ländern.
In den USA ist es weiter vollkommen normal, dass der Tarif Ihrer Autoversicherung je nach Automarke, Autotyp, Alter, Bildung, Wohnort, Geschlecht und unzähligen anderen Faktoren berechnet wird. Nur die Hautfarbe wird noch nicht herangezogen, das wäre wohl dann politisch inkorrekt.
Wenn Sie dann, so wie ich, einen ausländischen Führerschein haben, den Sie nach unzähligen Fahrstunden und Kursen langwierig erworben haben, müssen Sie trotzdem deutlich mehr zahlen, als jemand der einen US-Führerschein hat, den man auch in 30 Minuten bekommt. Ich wurde als Ausländer einfach in einen Topf mit Leuten geworfen, die für ein Kilo Kaffee Ihren Führerschein in irgendeinem Entwicklungsland bekommen haben. Das ist eine der Unschärfen in der Praxis. Pech.
Bei massenhafter Datenverarbeitung und Analyse zahlt es sich einfach nicht aus, auf den Einzelfall einzugehen. Das ist wie beim Tontaubenschießen. Wenn Sie nur wenige Schüsse haben und nur wenige Tontauben, dann konzentrieren Sie sich auf die eine Tontaube und zielen genau. So war das in unserer kleinen analogen Welt. Wenn Sie aber 100 Gewehre haben, die pro Sekunde 1 000 Schüsse abgeben und Sie müssen 10 000 Tontauben treffen, dann drücken Sie einfach nur drauf. Durch die Masse an Schüssen und Objekten treffen Sie im Großen und Ganzen schon irgendwas, solange Sie generell in die richtige Richtung zielen.
Ähnlich passiert das auch in vielen neuen Systemen zur massenhaften Datenauswertung. Die paar Schuss, die danebengehen, sind einfach nur eine Fehlerquote. Dabei fällt auch die Individualität des einzelnen Menschen in den Bereich Fehlerquote. Bleibt nur abzuwarten, ob durch noch mehr Daten und noch mehr Analysen dieser Daten die Auflösung höher und die Fehlerquoten kleiner werden. Eine paradoxe Hoffnung.
Ein weiteres Problem bei vielen der Phänomene, die als Big Data bezeichnet werden, ist, dass Sie in den meisten Fällen gar nicht nachvollziehen können, welche Faktoren in welchem Verhältnis bei einer solchen Analyse eine Rolle spielen. Nicht mal die Techniker, die diese Systeme erstellen, können das immer genau erklären. Ihnen reicht es oft, dass das System am Ende ein möglichst gutes Ergebnis bringt. Man probiert einfach verschiedene Versionen und vergleicht die Ergebnisse (»trial and error«). Die Version mit dem besten Ergebnis wird genommen. Details zu erforschen wäre auch wieder sinnlos investiertes Geld.
Noch einen großen Schritt weiter in unsere intimen Informationen geht es, wenn aus den bestehenden Daten nicht nur neue Daten generiert werden, sondern auch noch unser zukünftiges Verhalten hochgerechnet werden kann. Das hört sich jetzt für Sie vielleicht etwas absurd, futuristisch und nach dem Film »Minority Report« an, ist aber heute schon in vielen Bereichen Realität.
Ein Kreditranking ist nichts anderes als eine Wahrscheinlichkeit, dass Sie zukünftig Ihre Rechnungen zahlen. Errechnet wird das, je nach Kreditbüro, aus Ihrem bisherigen Verhalten und dem Vergleich mit dem Verhalten anderer Menschen, die Ihnen ähnlich sind. Die Prognosen sind so gut, dass Unternehmen durchaus viel für diese Informationen bezahlen.
Auch die Idee, Zukunftsvoraussagen mit unglaublich großen Datenmengen zu machen, ist nicht wirklich neu. Denken Sie an den Wetterbericht. Hier werden schon lange Milliarden Datenpunkte von Messstationen auf der ganzen Welt verrechnet, und am Ende kommt das Wetter der nächsten Stunden oder der nächsten zwei Wochen auf ein paar Kilometer genau raus. Das Ganze funktioniert auch mit einer sehr hohen Trefferwahrscheinlichkeit. Mit der immer billigeren Rechenleistung zogen solche Systeme auch bereits in anderen Bereichen, wie der Naturwissenschaft oder im Börsenhandel, ein.
Problematisch wird es für Sie, wenn nicht mehr das Wetter, Aktienkurse oder irgendwelche Objekte mit Milliarden Datenpunkten erfasst und dann analysiert werden, sondern Sie das Objekt der Berechnung werden. Wenn die Kosten für solche Analysen immer billiger werden und die Daten immer umfangreicher und genauer, so ist es nicht unwahrscheinlich, dass genau das die Zukunft ist. Die Messpunkte gibt es heute schon, und sie liefern jetzt schon Unmengen an Daten: Ihre Klicks, Ihre Suchanfragen, Ihre Handydaten und die Daten der vernetzten Geräte, die Sie täglich verwenden. Anreichern kann man das immer noch mit Daten von Datenhändlern oder anderen Personen. Aus all diesen kleinen Informationen wird Ihre persönliche Großwetterlage errechnet. Was Sie denken werden, was Sie zukünftig wollen könnten, wer Sie zukünftig sein werden. Dabei lassen sich Dinge vorhersagen, die Sie selbst noch gar nicht wissen. Weil das immer leichter und billiger wird, werden das auch immer mehr Unternehmen oder Staaten anwenden. Dass Unternehmen unser Kaufverhalten analysieren und uns dann gezielt sagen, was uns sonst noch interessieren könnte, ist heute schon Realität – vor allem im Netz. Ein extremeres Beispiel sind Systeme, die in den USA СКАЧАТЬ