Bot Traffic in GA4

Bot Traffic in GA4

Management Summary

Bot-Traffic ist ein weit verbreitetes Phänomen im digitalen Zeitalter und kann für Website-Betreiber und digitale Analysten sowohl mit Herausforderungen als auch Unannehmlichkeiten verbunden sein. Vor allem für Berichte in den Analyse-Tools ist es ärgerlich, wenn Berichte verfälscht werden und die Datenqualität abnimmt. In Google Analytics 4 (GA4) Berichten können Sie anhand verschiedener Indizien Bot Traffic erkennen und von Analysen ausnehmen. Das erhöht die Qualität und Aussagekraft Ihrer Daten.

Im folgenden Artikel wird erläutert, was Bot-Traffic ist und wie er identifiziert werden kann.

Was ist Bot Traffic?

Bot-Traffic ist der Datenverkehr im Internet, der durch automatisierte Softwareprogramme oder “Bots” erzeugt wird anstatt durch menschliche Benutzer. Bots sind Skripte oder Algorithmen, die entworfen wurden, um bestimmte Aufgaben auszuführen, wie beispielsweise das Indizieren von Websites für Suchmaschinen, das Sammeln von Informationen, das Automatisieren von Interaktionen auf Websites oder das Ausführen von Spam-Aktionen.

  • Suchmaschinen-Crawler: Suchmaschinen wie Google, Bing und Yahoo verwenden Bots, um das Internet nach neuen Inhalten zu durchsuchen und Websites zu indexieren.
  • Social Media Bots: Plattformen wie Facebook, Twitter und Instagram verwenden Bots, um Spam und unerwünschte Inhalte zu erkennen und zu entfernen. Diese Bots können auch verwendet werden, um Benutzeraktivitäten zu überwachen und Trends zu identifizieren.
  • Content-Scraping-Bots: Einige Bots werden verwendet, um Inhalte von Websites zu kopieren, um sie an anderer Stelle wiederzuverwenden. Dies kann zu Urheberrechtsverletzungen führen.
  • Schädliche Bots: Es gibt auch schädliche Bots, die für bösartige Aktivitäten verwendet werden. Beispiele hierfür sind Bots, die DDoS-Angriffe (Distributed Denial-of-Service) durchführen, Spam-Kommentare auf Blogs hinterlassen, persönliche Informationen stehlen oder automatisierte Angriffe auf Websites ausführen.
  • Datenanalyse-Bots: Unternehmen nutzen Bots, um Daten aus dem Web zu sammeln und zu analysieren. Dies kann verwendet werden, um Wettbewerbsinformationen zu sammeln, Preise zu vergleichen oder Marktforschung durchzuführen.

Welche Probleme kann Bot-Traffic verursachen?

Wie oben schon erwähnt, kann Bot-Traffic positive, aber auch sehr oft negative Auswirkungen haben und große Probleme verursachen:

  • Verzerrte Analysen: Wenn Bots auf Websites zugreifen, können sie den Webanalysen falsche Daten liefern und die Berichte verfälschen.
  • Verfälschte Klicks und Werbeeinnahmen: Bots können auf Werbeanzeigen klicken und so tun, als wären sie echte Benutzer, was zu verfälschten Klickraten und geringeren Werbeeinnahmen führen kann.
  • Überlastung des Servers: Wenn Bots in großer Anzahl auf eine Website zugreifen, kann dies zu einer Überlastung des Servers führen.
  • Sicherheitsrisiken: Schädliche Bots können dazu verwendet werden, Sicherheitslücken auf Websites auszunutzen, um Daten zu stehlen, Viren zu verbreiten oder andere bösartige Aktivitäten auszuführen.
  • Erhöhte Kosten aufgrund höherer Bandbreite und Serverressourcen.
  • Spam und unerwünschte Inhalte: Einige Bots werden verwendet, um Spam-Nachrichten, Kommentare oder Links auf Websites zu hinterlassen.
  • Datenverlust und -verfälschung: Bots können automatisiert Daten von Websites sammeln, kopieren und verfälschen. Dies kann zu einem Verlust von wertvollen Informationen führen und die Integrität der Daten gefährden.

Erkennt und blockiert GA4 Bot-Traffic?

Ja und Nein!
GA4 blockiert bekannten Bot-Traffic mithilfe von zwei verschiedenen Quellen. Zum einen durch Forschungsdaten von Google und zum anderen durch die „International Spiders and Bots List“, welche durch das Interactive Advertising Bureau (IAB) ermittelt wird.

Allerdings gibt es noch Bots, die von Google nicht erkannt bzw. gefiltert werden. Hauptsächlich sind das Bots von SEO-Tools oder Consent Management Plattformen (CMP). Aber auch neue und unbekannte bzw. gut getarnte Bots, welche sehr gut ein menschliches Verhalten simulieren, werden nicht erkannt. Außerdem gibt es Bots, die ihre IP-Adressen ändern und damit die Identifizierung für GA4 deutlich erschweren.

Wie identifiziere ich Bot-Traffic in Google Analytics?

Da wir in unseren GA4-Analysen keinen Bot- bzw. Spam-Traffic haben wollen, müssen wir versuchen, den falschen Traffic zu identifizieren und diesen danach im besten Fall zu filtern oder schon vorher auszuschließen.

Für das Erkennen eines solchen Traffics gibt es mehrere Herangehensweisen und Methoden, wobei alle Methoden eines gemeinsam haben -> Auffälligkeiten und verdächtiger Traffic sind immer ein starkes Indiz für Bots.

Welche Möglichkeiten habe ich nun, den unerwünschten Traffic zu erkennen?

  • Bildschirm-Auflösung: Bots nutzen häufig eine nicht mehr genutzte Bildschirmauflösung von z.B. 800×600 oder 400×400. Findet man solchen Traffic in den Berichten, sollte dieser genauer analysiert werden.

Bot Traffic in GA4 - screen-resolution

  • Betriebssystem: Eine weitere Auffälligkeit kann mit der Dimension „Betriebssystem“ gefunden werden. Im Screenshot  ist ein Peak mit dem Wert „Linux“ zu sehen. Üblicherweise nutzen nicht sehr viele Besucher Linux, daher sollte dieser Traffic näher analysiert und gegebenenfalls gefiltert werden.

Bot Traffic in GA4 - Betriebssystem

  • Browser-Version: Ein weiteres Anzeichen können veraltete Browser-Versionen sein. Üblicherweise werden die Browser der Nutzer laufend aktualisiert.
  • Kurze bzw. keine Sitzungsdauer: Bots haben meistens eine sehr kurze Sitzungsdauer oder gar eine Sitzungsdauer von 0 Sekunden.
  • Ungewöhnliche Quellen: Ein weiterer Hinweis können diverse Quellen sein, die unbekannt und/oder ungewöhnlich sind.Der folgende Screenshot ist sowohl ein Beispiel für die „kurze Sitzungsdauer“ als auch für „ungewöhnliche Quellen“.

Bot Traffic in GA4 - session medium

  • Geringe oder keine Interaktionen: Zugriffe mit wenigen oder keinen Interaktionen sind auch ein Indiz für Bots, da diese oft nicht in der Lage sind, mit der Seite zu interagieren.

Bot Traffic in GA4 - engaged-sessions

  • Extrem viele Events bei sehr wenig Nutzern: Umgekehrt ist es auch möglich, dass man ungewöhnlich viele Events bei sehr wenig Nutzern sieht.
  • Ungewöhnliche Länderzugriffe: Oft finden sich Zugriffe aus Ländern, die sehr ungewöhnlich sind für die Websites. Beispiel: Für einen deutschsprachigen Blog sind Zugriffe aus nicht-deutschsprachigen Ländern schon ungewöhnlich.
  • Traffic-Ausschläge an gleichen Tagen: Wenn man in den Berichten über einen längeren Zeitraum immer an denselben Tagen einen Traffic-Peak sieht, kommt der von Crawlern. Üblicherweise crawlen CMPs oder SEO-Tools immer an den gleichen Tagen und zur gleichen Uhrzeit die Website, um die Dienste der Tools  zu erfüllen.
  • Pageviews mit leeren Seitentitel

Zusammenfassend kann man sagen:

Immer, wenn die Zahlen sehr auffällig sind oder es extreme Peaks gibt, handelt es sich wahrscheinlich um Spam-Traffic und sollte dieser genauer analysiert werden. Die Qualität von Daten und Analyse-Berichten profitiert vom aufmerksamen Filtern oder dem Ausschließen von Daten aus Bot-Traffic.

Wie man Spam-Traffic vermeiden kann, erklären wir demnächst im zweiten Teil.

In unserem Blog finden Sie viele weitere Beiträge zum Thema Webanalytics und Google Analytics 4!
Bei Fragen stehen Ihnen unsere Analytics-Expert*innen gerne zur Verfügung: kontakt@e-dialog.group

Frau mit Brille und Kopfhörern arbeitet zu Hause am Laptop und blickt in die Kamera. KI-generiertes Bild.
Relevante Inhalte

Mehr zum Thema Analytics