Ausschluss von URL Parametern vor der Datenerfassung in Google Analytics
Management Summary
Was sind URL Parameter?
URL Parameter dienen grundsätzlich dazu, der URL (Uniform Resource Locator) eine Information hinzuzufügen. Sie werden vielseitig eingesetzt, wie zum Beispiel in internen Website-Suchen, Filterfunktionen in Webshops und in der Webanalyse vor allem als Tracking Parameter, um beispielsweise Traffic-Quellen zu kennzeichnen.
Ein Beispiel zum Aufbau einer Parameter URL:
Die interne Suche nach “analytics” auf e-dialog.at resultiert in folgender URL, in der über den Parameter “s” der Suchbegriff übergeben wird: e-dialog.group/?s=analytics
URL Parameter als Fehlerquelle in der Webanalyse
Diese Funktionalität ist gleichzeitig eine Fehlerquelle in der Webanalyse. Über URL Suchparameter fließen – oftmals unbewusst – Daten in den Seitenbericht in Google Analytics ein.
Daraus ergeben sich einige wesentliche Probleme:
Problem #1: viele Zeilen im Seitenbericht
Im Seitenbericht werden für eine URL sehr viele einzelne Zeilen ausgewiesen – nämlich eine Zeile je Parameter. Dies erschwert das Lesen des Berichts immens.
Problem #2: Zusammenfassung von URLs
Im Hinblick auf die Kardinalität (=Gesamtzahl der einzelnen Werte für eine Dimension) ergibt sich das Problem der maximal erfassbaren Zeilenanzahl von 50.000 im Seitenbericht von Google Analytics. Ist dieses Limit überschritten, werden alle weiteren URLs in der Zeile “other” zusammengefasst.
Problem #3: Erfassung personenbezogener Daten
Besonders problematisch ist es, wenn über URL Parameter personenbezogene Daten in Google Analytics erfasst werden. Formulare können zum Beispiel mittels POST oder GET übertragen werden. Bei GET sind die Parameter Teil der URL und würden somit an Google Analytics gesendet werden.
Laut Google Richtlinien ist es strengstens untersagt, personenbezogene Daten wie Vorname, Nachname und E-Mail Adresse in Google Analytics zu erfassen. Dies ist natürlich auch im Hinblick auf die DSGVO kritisch. Aus diesem Grund sollte die POST Methode verwendet werden, in der Parameter nicht Teil der URL sind.
Wie Sie Nutzerdaten aus Google Analytics wieder löschen, erfahren Sie hier.
e-dialog Best Practice:
- Nur für die Auswertung erforderliche Suchparameter an Google Analytics senden
- Personenbezogene Daten dürfen nicht an Google Analytics übermittelt werden
Whitelist erstellen – so filtern wir URL Parameter in der Praxis
Aus den oben genannten Gründen empfiehlt es sich, in der Praxis eine Whitelist über den Google Tag Manager umzusetzen, die nur zuvor definierte Parameter zulässt. Alle Parameter, die nicht auf der Whitelist stehen, werden vom URL String, der an den Google Analytics-Request angehängt wird, entfernt. Wir haben eigens hierfür ein Skript erstellt.
Erforderliche Schritte:
1. Übersicht zu den auszuschließenden URL Parameter erstellen. Über eine API-Abfrage beispielsweise können die URL-Suchparameter abgefragt werden. So bekommen wir einen Überblick über die URL-Suchparameter.
2. Daraufhin definieren wir, welche URL-Suchparameter auf die Whitelist gesetzt werden.
3. Dann wird diese Whitelist via GTM umgesetzt.
Vorteile dieser Vorgehensweise
- Über den GTM (Google Tag Manager) werden die URL Suchparameter erst gar nicht an Google Analytics gesendet.
- Die Daten werden auf Property Ebene ausgeschlossen (ein Ausschluss der URL-Suchparameter auf Datenansichts-Ebene reicht nicht aus, da die Daten auf Property-Ebene gespeichert werden).
- Für die erwünschten UTM-Parameter, mit denen in Google Analytics zum Beispiel Kampagnen erfasst werden, gibt es eine Variable, die auf True oder False gesetzt werden kann.
- Sollte über Parameter, die auf der Whitelist stehen, doch E-Mail-Adressen an Google Analytics gesendet werden, sieht unsere Lösung eine Pseudonymisierung dieser vor.