von Sophie Srnka
RegExp Formeln helfen bei der Analyse und Aufbereitung von Daten in verschiedenen Online Marketing Programmen (z.B. Data Studio, Google Analytics,...) - zwar schrecken sie oft durch ihr komplexes Aussehen ab, doch mit Ruhe, Geduld und einem neugierigen Mindset sind die Grundlagen schnell erlernt. Um RegExp Formeln effizient verwenden zu können, ist es wichtig, dass die Benennung der Dimensionen einheitlich und korrekt ist.
Wir bringen Ihre programmatischen Kampagnen auf das nächste Level. Unsere Consultants unterstützen mit Konzepten, Consulting und auch managed Service.
Mehr ErfahrenWir erklären dir die 3 wichtigsten und nützlichsten RegExp Formeln und wie du sie verwenden kannst::
Grundsätzlich setzt sich eine RegExp Formel aus der Datenquelle, der Dimension und der Formel selbst zusammen. Campaign Manager, DV360 und Google Analytics sind zum Beispiel häufig verwendete Datenquellen für Dashboards.
Die Dimensionen kommen aus der Datenquelle. So kann aus einer Campaign Manager Datenquelle “Placement” genommen werden und aus einer DV360 Datenquelle “Insertion Order” – mischen funktioniert jedoch nicht. Dafür benötigt es einen Data-Blend speziell für das Dashboard, oder eine BigQuery Datenquelle, auf die immer wieder zugegriffen werden kann.
In Data Studio können auf zwei verschiedene Arten RegExp Formeln erstellt werden. Nur für eine bestimmte Tabelle oder als weitere Dimension für das gesamte Dashboard.
RegExp Formel in Data Studio erstellen: 1.: Für die ausgewählte Tabelle / 2.: Für das Dashboard
Um RegExp Formeln zu verwenden, brauchen wir noch ein Grundverständnis der verschiedenen Zeichen, welche zum Erstellen der Formel verwendet werden können. Es gibt noch einige mehr, aber hier die wichtigsten kurz erklärt:
Um Wörter und Zahlen in einer RegExp Formel zu ersetzen, ohne jede erdenkliche Kombination angeben zu müssen, kann Punkt-Asterisk ( .* ) verwendet werden. Der Punkt ( . ) ist in RegExp ein Symbol für ein Zeichen. Es steht also für Buchstaben, Zahlen und Sonderzeichen, die in der Benennung verwendet werden können.
Das Asterisk ( * ) gibt an, dass es sich um eine längere Anzahl von Zeichen handelt – somit wird ein ganzes Wort abgedeckt. Punkt-Asterisk ersetzt solange die Zeichen in einer Formel, bis es auf das nächste – in der RegExp Formel angegebene – Zeichen trifft. Daher ist es üblich, in Benennungen Hyphen ( – ) oder Underscores ( _ ) zu verwenden, um das Arbeiten mit RegExp Formeln zu vereinfachen.
So muss zum Beispiel für
Awareness_Sujet
Engagement_Sujet
nicht zwei Formeln angelegt werden, sonder nur eine
.*_Sujet
In diesem Fall ersetzt das Punkt-Asterisk sowohl “Awareness” als auch “Engagement”.
Pipes ( | ) werden in RegExp Formeln dazu verwendet, um zwei Wörter gleichzeitig in einer Formel anzuführen. So können zum Beispiel mehrere Formate zusammen genommen werden:
(HPA|MediumRectangle)
Klammern werden in RegExp Formeln auf zwei verschiedene Arten verwendet. Einerseits benötigt jede RegExp Formel eine runde Klammer ( ( & ) ) am Anfang und Ende der Funktion, um sie abzugrenzen.
Die zweite Funktion der runden Klammern ist, einen Teil des Dimensions-Namens hervorzuheben. Mehr dazu in den Beispielen für REGEXP_EXTRACT und REGEXP_MATCH
Die Anführungszeichen ( “ “ ) werden am Anfang und Ende vom Text gesetzt, die in der RegExp Formel verwendet werden. Sowohl für den Namen der Dimension, als auch für den selbstgewählten Text, der in der Formel angegeben wird.
Für die kommenden Beispiele wird folgender Datensatz verwendet:
Display_Awareness_HPA_Katze
Display_Awareness_HPA_Hund
Display_Awareness_MediumRectangle_Katze
Display_Awareness_MediumRectangle_Hund
Display_Engagement_HPA_Katze
Display_Engagement_HPA_Hund
Display_Engagement_MediumRectangle_Katze
Display_Engagement_MediumRectangle_Hund
Hieraus können Informationen zum Kanal (Display oder Video), zur Funnel Stufe (Awareness oder Engagement), dem Format (HPA, Medium Rectangle oder PreRoll) und dem Sujet (Katze oder Hund) gezogen werden.
Um RegExp Formeln verwenden zu können, ist es wichtig, dass die Benennung der Dimensionen einheitlich und korrekt ist.
Mit der EXTRACT Formel werden einzelne Wörter aus der Dimension gezogen. So kann zum Beispiel aus dem Datensatz die Funnelstufe – Awareness oder Engagement – entnommen werden:
REGEX_EXTRACT (Placement,(Awareness|Engagement))
Ergebnis:
Engagement
Awareness
Da es sowohl Awareness als auch Engagement gibt, werden diese mit einer Pipe zusammengefasst in der Formel angegeben. Aus dem Beispieldatensatz von 12 Zeilen werden somit 2 – jeweils eine Zeile pro Funnel Stufe.
Die Formel kann jedoch auch flexibler angewandt werden. Gibt es noch weitere Funnel Stufen (z.B. Performance oder Loyalty) können diese entweder ergänzt werden, oder mittels dem Punkt-Asterisk ( .* ) ausgelesen werden.
Der Vorteil durch den Punkt-Asterisk ( .* ) ist, dass nicht alle möglichen Funnel Stufen aufgelistet werden müssen. Diese Flexibilität ist bei variierenden Bezeichnungen, wie Sujet Namen, besonders hilfreich.
REGEX_EXTRACT (Placement,”Display_(.*)_.*”)
Display_Engagement_MediumRectangle_Katze
Display_Awareness_HPA_Hund
Ergebnis:
Engagement
Awareness
Diese Formel ist etwas komplexer im Aufbau, da nicht mehr die genauen Wörter angegeben werden. Die Formel muss zu der Stelle, an der sich die Wörter befinden, hingeführt werden.
Der Aufbau der Formel ergibt sich folgendermaßen:
REGEX_EXTRACT ( )
Placement
,
= die Funktion, die verwendet wird
= die Dimension, die verwendet wird
= die Kommastelle nach der Dimension gibt an, dass nun die Regel der Funktion folgt.
”Display_
(.*)
_.*”)
= der Anfang des Placement Namens
= mit den Klammern wird signalisiert, dass dieses Wort – ersetzt durch Punkt-Asterisk – herausgenommen wird
= durch das letzte Punkt-Asterisk wird der Rest des Placement Names ersetzt.
Mit dem Anführungszeichen wird der Dimensions-Name umschlossen und mit der runden Klammer die RegExp Formel.
Im Beispieldatensatz fangen alle Zeilen gleich an, mit “Display_” was sich die Formel zu Nutzen macht. Haben die Zeilen jedoch unterschiedliche Anfänge, wie “Display_” und “Video_”, kann auch der Anfang durch einen Punkt-Asterisk ( .* ) ersetzt werden.
REGEX_EXTRACT(Placement,”.*_(.*)_.*”)
Display_Engagement_MediumRectangle_Katze
Display_Awareness_HPA_Hund
Ergebnis:
Engagement
Awareness
Mit derselben Logik können auch Wörter, die später im Placement Namen erscheinen, herausgenommen werden. So nimmt zum Beispiel diese Formel das Format heraus:
REGEX_EXTRACT(Placement,”.*_.*_(.*)_.*”)
Display_Engagement_MediumRectangle_Katze
Display_Awareness_HPA_Hund
Ergebnis:
MediumRectangle
HPA
EXTRACT eignet sich, um schnell Daten zusammenzufassen und zu analysieren.
Die MATCH Funktion wird im Zusammenhang einer weiteren Funktion verwendet. So kann Data Studio dazu verwendet werden, um alle gematchten Zeilen einer Kategorie zuzuordnen.
CASE
WHEN (REGEXP_MATCH Formel 1) THEN “Kategorie 1”
WHEN (REGEXP_MATCH Formel 2) THEN “Kategorie 2”
ELSE “fehlender Wert”
END
Nachdem es sich hier um ein selbst programmiertes Feld handelt, ist es wichtig, am Anfang CASE und am Ende END zu verwenden, um die Funktion einzugrenzen.
WHEN beschreibt die Kondition, unter die THEN eintritt. ELSE muss bei WHEN Formeln verwendet werden – es ist dadurch möglich, alles, was nicht in die vorher bestimmten Kategorien fällt, zusammen zu ziehen, oder um eine Fehlermeldung anzuzeigen.
Der Aufbau der reinen MATCH RegExp Formel ist ähnlich der EXTRACT Formel:
REGEXP_MATCH(Placement,”.*_(Katze|Hund)”)
Display_Engagement_Medium Rectangle_Katze
Display_Awareness_HPA_Hund
Zusammen mit der WHEN – THEN Funktion kann so zum Beispiel eine Kategorie für das Sujet festgelegt werden:
CASE
WHEN REGEXP_MATCH(Placement,”.*_(Katze|Hund)”) THEN “Tier”
ELSE (“other”)
END
Ergebnis:
Tier
Die MATCH Formel eignet sich auch, um Abkürzungen, die sich im Placement Namen befinden, wieder aufzubereiten:
CASE
WHEN REGEXP_MATCH(Placement,”.*_(HPA)_.*”) THEN “Half Page Ad”
ELSE (“other”)
END
Ergebnis:
Half Page Ad
MATCH in Verbindung mit WHEN – THEN ist eine der flexibelsten Funktionen in Data Studio.
Im Gegensatz zu den bis jetzt besprochenen Funktionen gibt CONTAINS kein Wort oder Kategorie zurück, sondern ob eine Aussage TRUE oder FALSE ist.
Es sollte daher die Formel:
REGEX_CONTAINS (Placement,”Display”)
Display_Engagement_MediumRectangle_Katze
Display_Awareness_HPA_Hund
für alle Zeilen des Beispiel-Datensatzes TRUE ergeben.
CONTAINS wird nicht in der Datenanalyse verwendet, sondern hilft bei der Fehlersuche, um Tippfehler oder falsche Reihenfolgen in der Benennung zu finden.
Mit RegExp Formeln können Datensätze effizient zusammengefasst, analysiert und kontrolliert werden, außerdem erleichtern sie die Arbeit mit großen Datensätzen. Wir versprechen, nachdem der erste Schreck vorbei ist, macht es großen Spaß!
Wir freuen uns auf Ihre Anfrage und beraten Sie gerne unverbindlich! Füllen Sie dazu einfach das Kontaktformular aus oder rufen uns direkt an.
Jetzt kontaktierenNewsletter
Holen Sie sich unsere Online Marketing-Insights und Trends direkt in Ihr Postfach!