Online-Dienste sammeln eine Menge Daten. Technologiegiganten wie Google, Microsoft und Meta (ehemals Facebook) machen ein Geschäft daraus, Benutzerdaten zu sammeln und an Datenhändler und Werbetreibende zu verkaufen. Sie versuchen, die Angst vor einem Missbrauch dieser Daten zu zerstreuen, indem sie behaupten, Ihre Daten zu anonymisieren und unkenntlich zu machen. Aber ist die Datenanonymisierung wirklich anonym?
Wichtige Erkenntnisse: Anonymisierung der Daten
- Techniken zur Datenanonymisierung und De-Identifizierung versuchen, die Identität von Personen in einem Datensatz zu verbergen, indem direkt oder indirekt identifizierende Daten entfernt werden.
- Viele Anonymisierungsmethoden sind mangelhaft und können dazu führen, dass Ihre anonymisierten Daten wieder Ihrer Person zugeordnet werden.
- Wenn Sie im Internet vorsichtig sind und ein VPN verwenden, können Sie einige der Mängel der Datenanonymisierung verringern.
Lesen Sie weiter, um zu erfahren, wie Datenanonymisierung und De-Identifizierung funktionieren und warum Sie auch bei der Verwendung von Diensten, die Daten anonymisieren, Vorsichtsmaßnahmen treffen sollten. Wir schlagen Ihnen auch einige Dienste vor, mit denen Sie versuchen können, so unauffällig wie möglich zu bleiben, auch wenn echte Anonymität nahezu unmöglich ist.
Alle anzeigen
Treffen Sie die Experten
Erfahren Sie mehr über unser Redaktionsteam und unseren Rechercheprozess.
Definition der Datenanonymisierung
Datenanonymisierung ist eine Methode der Datenverarbeitung, bei der persönlich identifizierbare Informationen aus einem Satz personenbezogener Daten über eine bestimmte betroffene Person entfernt werden. Bestimmte Datenschutzgesetze wie die DSGVO verlangen, dass Unternehmen und andere Datenverantwortliche alle gesammelten und gespeicherten Daten anonymisieren, um die Datenvertraulichkeit für die von ihnen abgedeckten betroffenen Personen zu gewährleisten.
Ziel der Datenanonymisierung ist es, die Identifizierung einzelner Personen innerhalb eines Datensatzes zu verhindern.
Es gibt zahlreiche Möglichkeiten, Daten so zu anonymisieren, dass sie für Analysezwecke noch nützlich sind. Leider ist diese Art der Datenanalyse nicht immer die lukrativste Verwendung all dieser sensiblen Daten. Stattdessen ist es viel profitabler, diese Daten an Werbetreibende zu verkaufen, die sie verwenden können, um Personen anzusprechen, die in bestimmte Kategorien fallen.
Dies bedeutet, dass die meisten Online-Dienste keine wirksamen Methoden zur Anonymisierung verwenden und stattdessen Spuren hinterlassen, anhand derer eine Person dennoch identifiziert werden kann.
Was sind identifizierbare Daten?
Identifizierbare Daten sind einfach alle Daten, die verwendet werden können, um auf eine bestimmte Person zu verweisen. Es gibt jedoch mehrere Ebenen zu identifizierbaren Daten.
De-Identifizierung vs. Anonymisierung vs. Pseudonymisierung
- De-Identifizierung bezieht sich auf die Entfernung direkt identifizierender Daten aus dem Profil einer betroffenen Person. Einige potenziell identifizierende Daten bleiben übrig, und dazu können auch sensible Daten wie Rasse, Geschlecht oder politische Zugehörigkeit gehören. Anonymisierte Daten können wieder identifiziert werden.
- Anonymisierungsollte bei richtiger Ausführung alle identifizierbaren Daten aus einem Datensatz entfernen, einschließlich indirekter Kennungen. Wenn indirekt identifizierbare Daten erhalten bleiben, sollte idealerweise eine Datenmaskierung, -generalisierung oder -aggregation eingesetzt werden, um sicherzustellen, dass sie nicht zur Identifizierung einer Einzelperson verwendet werden können. Eine echte Datenanonymisierung ist unumkehrbar.
- Pseudonymisierung entfernt direkte Kennungen aus einem Profil und ersetzt sie durch Pseudonyme. Dies ist zwar weniger privat als die Anonymisierung, aber in bestimmten Wissenschaftsbereichen ist die Pseudonymisierung notwendig und wird häufig bei medizinischen Studien und anderen wissenschaftlichen Untersuchungen eingesetzt.
Techniken zur Datenanonymisierung
Es gibt mehrere Methoden, mit denen ein Datenverantwortlicher Daten anonymisieren kann. Allerdings können nur wenige einen irreversibel anonymen Datensatz erstellen.
Das bloße Löschen direkt identifizierender Informationen reicht möglicherweise nicht aus, um eine erneute Identifizierung zu verhindern.
1. Löschen direkter und indirekter Bezeichner
Das Löschen direkter Kennungen ist der einfachste (oder bequemste) Weg, Daten zu anonymisieren. Nach der DSGVO gilt dies als Anonymisierung und ist nicht vollständig anonym. Pseudonymisierte Daten können durch Datenabgleich rückgängig gemacht werden.
2. Pseudonymisierung oder Tokenisierung
Wir haben diese Methode bereits besprochen, bei der private Kennungen durch falsche Kennungen, sogenannte Pseudonyme oder Token, ersetzt werden. Diese Methode bietet keinen besseren Schutz als das Löschen und kann bei unsachgemäßer Anwendung sogar leichter rückgängig gemacht werden.
3. Datenmaskierung
Beim Maskieren werden Daten innerhalb eines Satzes durch fiktive Daten ersetzt. Dies kann im laufenden Betrieb erfolgen, wobei die Informationen geändert werden, sobald man auf die Daten zugreift. Alternativ kann ein Datenverantwortlicher einen erweiterten Datensatz erstellen und gleichzeitig eine Sicherungskopie des ursprünglichen Datensatzes aufbewahren.
4. Einführung von statistischem Rauschen
Statistisches Rauschen ist ein Fehler im Datensatz, der es schwieriger macht, eine Einzelperson zu identifizieren. Es gibt mehrere Möglichkeiten, Rauschen in einen Datensatz einzubringen und die ursprünglichen Daten zu verschleiern:
Dies ist eine der besten Methoden zur Datenanonymisierung, da dabei ein Datensatz generiert wird, der zufälliges Rauschen enthält und sich erheblich vom ursprünglichen Datensatz unterscheidet.
5. Datenaggregation
Die Aggregation ist die einzige wirklich irreversible Methode zur Anonymisierung von Daten und stellt die gesammelten Daten als aggregierte Werte dar, ohne dass einander Attribute zugeordnet werden.
6. Synthetische Daten
Synthetische Daten sind keine realen Daten. Vielmehr handelt es sich um einen Datensatz, der mithilfe verschiedener Algorithmen aus einem realen Datensatz abgeleitet wird. Methoden, die künstliche Datensätze erstellen, sind am sichersten, da die darin gespeicherten Daten tatsächlich fiktiv sind und gleichzeitig genügend statistische Ähnlichkeit mit dem Original aufweisen, um für die Forschung nützlich zu sein.
Wie können de-identifizierte oder anonymisierte Daten wieder identifiziert werden?
Dienste, die behaupten, Benutzerdaten zu anonymisieren, versprechen, Ihre Daten von allen identifizierenden Informationen zu bereinigen. Welche Informationen gelten jedoch als identifizierend? Rechtlich gesehen sind das Dinge wie Ihr Name, Ihre IP-Adresse, Ihre E-Mail-Adresse oder andere Kontaktinformationen. In der Praxis ist jedoch viel weniger erforderlich, um Sie tatsächlich zu identifizieren.
Schon aus wenigen Datenpunkten lassen sich Datenprofile zusammenstellen, die einer bestimmten Person zugeordnet werden können.
Lass uns ein Spiel spielen. In diesem Spiel beschreibst du deinen anderen Freunden einen Freund, aber ohne seinen Namen oder seine Adresse zu nennen. Du greifst auf die Beschreibung seiner Hobbys zurück, was er beruflich macht und welches College er besucht hat. Du kannst darauf wetten, dass deine Freunde die Person ziemlich schnell identifizieren können. Das nennt man Re-Identifizierung.
In einem berüchtigten Fall Katholischer Priester musste zurücktreten seine Position, nachdem es einem Herausgeber eines religiösen Newsletters gelungen war, ihn zu identifizieren – mithilfe von Daten, die er legal von einem Broker erworben hatte. Die Daten umfassten App-Nutzungsdaten, darunter die Gay-Dating-App Grindr, sowie Standortdaten, die Besuche in Schwulenbars, sein Zuhause und seinen Arbeitsplatz zeigten.
Reidentifizierungsmethoden
Einen Datensatz erneut zu identifizieren bedeutet, ihm eine reale Person zuzuordnen. Dies ist für einen Datenhändler relativ einfach, da er über mehrere Datenpunkte verfügt, die er zwischen Datensätzen vergleichen kann. Hier sind einige Möglichkeiten, anonymisierte Daten zu de-anonymisieren.
1. Datenabgleich oder Datenverknüpfung
Ein Datenhändler hat möglicherweise Ihren Namen und Ihre E-Mail-Adresse sowie ein paar weitere Informationen – beispielsweise Ihre Schule, Rasse, Ihr Geschlecht und Ihren Geburtstag. Er kann dann anonymisierte Daten von einem Onlinedienst sammeln, die Ihren Namen und Ihre E-Mail-Adresse nicht enthalten, diese anderen Datenpunkte jedoch schon.
Der Datenbroker muss lediglich den neuen Datensatz mit dem alten vergleichen, um die Überschneidungen zu ermitteln und schon hat er die anonymisierten Daten neu identifiziert.
2. Ausnutzung fehlerhafter Anonymisierung
Wenn der Datenverantwortliche direkte Kennungen löscht, verbleiben möglicherweise zahlreiche indirekte Kennungen im Datensatz, die zur Identifizierung einzelner Personen und zur Offenlegung vertraulicher Informationen über diese Personen verwendet werden können.
3. Pseudonym oder Token-Umkehr
Wenn ein Datensatz mit einer minderwertigen Technik, wie beispielsweise einfacher Zeichenersetzung, pseudonymisiert wurde oder wenn ein Schlüssel zur Zuweisung von Pseudonymen verwendet wurde, gibt es Möglichkeiten, die Pseudonymisierung rückgängig zu machen. Wenn man beispielsweise den Schlüssel erfährt, ist es einfach, die Pseudonymisierung rückgängig zu machen.
4. Fortgeschrittene KI-Modelle
Fortschritte in der Datenanalysetechnologie haben es viel einfacher gemacht, anonymisierte Daten wieder zu identifizieren. Dank der jüngsten Durchbrüche in der KI können Technologien wie Algorithmen des maschinellen Lernens in Verbindung mit anderen statistischen Methoden nun dazu verwendet werden, einer Person in einem anonymisierten Datensatz einen Namen zuzuordnen.
HIPAA und De-Identifizierung
Wenn Sie sich mit den Datenschutzgesetzen in den USA auskennen, haben Sie zumindest vom Health Insurance Portability and Accountability Act, kurz HIPAA, gehört. HIPAA ist ein Datenschutzgesetz, das regelt, wie Datenverantwortliche mit sensiblen medizinischen Daten umgehen. Unter anderem verhindert es, dass jemand außer der betroffenen Person auf ihre Krankengeschichte zugreift.
HIPAA ist ein Gesetz, das den Umgang mit medizinischen Daten regelt.
Allerdings erlaubt HIPAA die Verwendung anonymisierter Daten für Zwecke wie die medizinische Forschung. Wenn die Daten nicht richtig anonymisiert sind, können sie dennoch zur Identifizierung einer Person verwendet werden. Dies geschah bekanntlich im Jahr 1996als Latanya Sweeney die gesamte Krankengeschichte des Gouverneurs von Massachusetts, Bill Weld, aufdecken konnte, indem sie zwei im Handel erhältliche Datensätze verglich, die nur 20 US-Dollar kosteten.
Glücklicherweise Die HIPAA-Vorschriften haben sich geändert seitdem besteht allerdings weiterhin das Risiko einer unsachgemäßen Anonymisierung der Daten.
So schützen Sie Ihre Daten
Obwohl die einzige Möglichkeit, Ihre Daten privat zu halten, darin besteht, Ihren Router in Stücke zu hauen und nie wieder eine Verbindung zum Internet herzustellen, ist das für die meisten Leute vielleicht zu drastisch. Wenn Sie Ihr Privatleben privat halten und trotzdem den Luxus des Internets genießen möchten, gibt es ein paar Dinge, die Sie tun können.
1. Social-Media-Nutzung einschränken oder minimieren
Soziale Medien stellen derzeit eines der größten Datenschutzrisiken für Internetnutzer dar. In den meisten sozialen Medien geht es darum, die Details Ihres Lebens preiszugeben. Wenn Sie die Nutzung sozialer Medien auf die Kommunikation beschränken, wird Ihr digitaler Fingerabdruck erheblich reduziert.
Darüber hinaus könnten Sie ein Pseudonym und eine Wegwerf-E-Mail-Adresse oder Telefonnummer verwenden und bei der Anmeldung für ein Social-Media-Konto keine echten Daten angeben.
2. Lesen Sie die Datenschutzrichtlinien, bevor Sie Ihre Zustimmung erteilen
Datenschutzrichtlinien geben Aufschluss darüber, welche Art von Daten ein Dienst sammelt. Wenn Sie mit der Menge an Daten, die für die Nutzung eines Dienstes erforderlich ist, unzufrieden sind, sollten Sie nach einer Alternative suchen.
3. Cookies blockieren
Mittlerweile ist es für alle Websites gesetzlich vorgeschrieben, die Zustimmung zur Verwendung von Cookies einzuholen. Einige Cookies sind für die Funktion der Website zwingend erforderlich, Sie sollten jedoch alle anderen Cookies ablehnen. Hier finden Sie eine ausführliche Anleitung zum Löschen von Cookies.
4. Melden Sie sich von Ihrem Browser-, Google-, Apple- oder Microsoft-Konto ab
Wenn Sie in einem Browser angemeldet sind, ist es sehr wahrscheinlich, dass Ihre E-Mail-Adresse mit Ihren Internetaktivitäten verknüpft wird. Wenn Sie Google und andere Suchmaschinen verwenden, während Sie angemeldet sind, wird Ihr Suchverlauf protokolliert. Melden Sie sich, wenn möglich, auch vom Microsoft- oder Apple-Konto Ihres Geräts ab, um die Daten zu minimieren, die diese Unternehmen sammeln können.
5. Verwenden Sie ein VPN
VPNs ermöglichen Ihnen anonymes Surfen im Internet, indem sie Ihren Internetverkehr verschlüsseln und Ihre IP-Adresse verschleiern. Dadurch können Ihr ISP, die Regierung oder Hacker nicht sehen, was Sie online tun. Das bedeutet, dass Datenverantwortliche Ihre Online-Aktivitäten nicht mit einer bestimmten IP-Adresse in Verbindung bringen können. Hier ist unsere Liste der besten VPNs, falls Sie Hilfe bei der Auswahl benötigen.
6. Löschen Sie Ihre Daten aus den Data Broker-Archiven
Gemäß der DSGVO und ähnlichen Gesetzen haben Sie Anspruch auf die Löschung Ihrer gespeicherten Daten. Sie können einen Datenbroker kontaktieren und ihm mitteilen, dass Sie die Löschung Ihrer Daten wünschen.
Es sind jedoch zu viele, um sie alle einzeln zu kontaktieren, und ein Dienst wie Incogni oder DeleteMe von Surfshark (lesen Sie unseren DeleteMe-Testbericht) kann Ihnen dabei helfen, diesen Vorgang zu automatisieren. Sie müssen nur Ihre E-Mail-Adresse und ein paar andere Details angeben, und der Datenentfernungsdienst löscht Ihre Daten, wo immer es möglich ist.
Abschließende Gedanken: Datenanonymisierung und De-Identifizierung
Im Internet anonym zu bleiben ist praktisch unmöglich. Das Internet ist riesig und wir nutzen so viele Dienste, dass man nie wirklich sicher sein kann, dass sie anonym sind. Selbst wenn ein Dienst behauptet, Ihre Daten zu anonymisieren oder zu de-identifizieren, gibt es immer noch Möglichkeiten, diese Daten mit Ihnen zu verknüpfen.
Was wahrscheinlich noch beängstigender ist, ist der schnelle Fortschritt öffentlich verfügbarer KI-Modelle wie ChatGPT, die die Reidentifizierung Ihrer Daten noch einfacher machen können.
Was denken Sie darüber? Vertrauen Sie Diensten, die behaupten, Ihre Daten zu anonymisieren? Verwenden Sie ein VPN, um sich online zu schützen? Lassen Sie es uns in den Kommentaren unten wissen und wie immer vielen Dank fürs Lesen.
Häufig gestellte Fragen
- Was bedeutet Anonymisierung?
Unter Anonymisierung versteht man den Vorgang, persönlich identifizierbare Daten aus einem Datensatz zu entfernen.
- Was ist der Zweck der Datenanonymisierung?
Das Ziel der Anonymisierung von Daten besteht darin, sie analysieren zu können, ohne die Privatsphäre der im Datensatz enthaltenen Personen zu gefährden.
- Was ist Pseudonymisierung?
Pseudonymisierung ist eine Form der Anonymisierung, bei der identifizierende Daten durch ein Pseudonym oder Token ersetzt werden.
Sagen Sie uns Bescheid, ob Ihnen der Beitrag gefallen hat. Nur so können wir uns verbessern.
Ja Nein