Die Datenspur im Internet - Teil 1/4
Aktivitäten im Internet können aufgezeichnet, gespeichert und ausgewertet werden. Soweit ist das wohl jedem bekannt.
Das Tracking ist im Internet allgegenwärtig und nicht einfach nachvollziehbar. Ohne technisches Verständnis ist es kaum möglich, zu erkennen welche Daten von wem aufgezeichnet werden. Die verschiedenen Anbieter haben sich ein undurchsichtiges Netzwerk aufgebaut, in dem sie ungestört mit den unterschiedlichsten Daten handeln können. Es gleicht einem Spiegel im Verhörraum, wie im Artikel „Behind the One-Way Mirror“ (https://www.eff.org/wp/behind-the-one-way-mirror) beschrieben: Derjenige im Verhörraum sieht nur sich selbst und kann nicht beurteilen von wem und wie vielen er beobachtet wird, während die Personen auf der anderen Seite alles ungestört betrachten können.
Es ist also schwer, das Tracking zu erkennen und zu unterbinden. Allerdings gibt es technische Möglichkeiten, um das Verhalten von Webseiten zu beobachten und Tracking einzuschränken.
Developer-Tools im Browser
Die einfachste Variante, um Tracking-Verhalten zu beobachten ist es, die vorhandenen Developer-Tools des Browsers zu benutzen. Diese lassen sich leicht in jedem gängigen Browser aufrufen. Über die Tools können die Cookies angeschaut werden, die von den Webseiten gesetzt werden.
Weiterhin lassen sich mit der Browsererweiterung "uBlock Origin" Tracking-Dienste blockieren. Die blockierten Verbindungen kann man sich dann über die Erweiterung ansehen.
Sehen wir uns zunächst die Verbindungen von golem.de über Google Chrome näher an.
Dabei wurden mehrere Skripte von Trackingdiensten blockiert, unter anderem:
cdn.stroeerdigitalgroup.de/metatag/live/ctc_golem/metaTag.min.js
pagead2.googlesyndication.com/pagead/js/adsbygoogle.js
de.ioam.de
www.googletagmanager.com
Von vornherein war klar, dass aufgrund der Werbung auf der Seite Trackingdienste verwendet werden, aber es überrascht doch wieviele verschiedene Anbieter es sind. Bei dem Aufruf mit uBlock Origin wurden nur Cookies von golem.de selbst gesetzt.
Danach wurde die Seite ohne uBlock Origin geladen und die Cookies analysiert.
Allein beim initialen Aufruf der Seite werden Cookies von 16 (!) Third-Party Domains gespeichert. Darunter sind Domains von Google (ad.doubleclick.net
), Amazon (amazon-adsystem.com
) und OpenX (openx.net
).
Bei golem.de wird Third-Party Tracking verwendet. Beim Third-Party Tracking werden durch Skripte neben golem.de weitere Seiten im Hintergrund nachgeladen, die dann im Browser Cookies abspeichern. Das Tracking erfolgt also nicht durch Golem selbst sondern durch außenstehende Dienste.
In einem nächsten Schritt wurde ein neues Browserprofil erstellt. In dem neuen Profil sind logischerweise noch keine Cookies gesetzt, weil noch keine Webseiten aufgerufen wurden. Mit diesem Profil wurde wieder ohne uBlock Origin die Webseite golem.de aufgerufen.
Bei dem Aufruf wird unter anderem ein Cookie von googleads.g.doublclick.net
mit dem Namen IDE und dem Wert
AHWqTUlKbmGqDdfHa5QAnKART8JRzlQqBqukliW4LWxJQKdmXMxeS8_ZoCQ0oMWG
gespeichert.
Nun wurden andere Webseiten besucht und überprüft, ob auf diesen Cookie zugegriffen wird. Für die Überprüfung wurde die Entwickleroberfläche des Browsers genutzt. Über Netzwerk in den Entwickleroberfläche vom Browser können nämlich alle Netzwerkanfragen gefiltert werden.
Mit der Suche nach cookie-name:IDE
werden alle Anfragen mit dem entsprechenden Cookie angezeigt. Sowohl bei dem Besuch der Seiten spiegel.de, youtube.com als auch bei der normalen Google-Suche wurde der Cookie versendet.
Bei amazon.com wurde das sogenannte Cookie-Syncing beobachten, welches durch einen Tracking-Pixel ausgelöst wurde. Bei Cookie-Syncing wird der Cookie an s.amazon-adsystem.com
geschickt. Bei der Analyse von Amazons Startseite ist aufgefallen, dass viele Anfragen geschickt werden, die pixel?id
oder sync?id
in ihrer URL haben. Dabei werden verschiedene fremde Dienste angefragt, wie z.B. Google, Facebook, Yahoo oder auch IMDb. Viele davon werden an s.amazon-adsystem.com
weitergeleitet. Das deutet darauf hin, dass Amazon die verschiedenen Tracking-IDs der Anbieter abspeichert und synchronisiert.
Dies ist Teil 1 der 4-teiligen Betrachtung "Datenspur im Internet"