von Sandra Wojciechowska
Data Science, Data Engineering, Machine Learning, Cloud Engineering - diese Begriffe sind die Basis des Datadriven Advertising. In diesem Blogartikel gehen wir ihnen auf den Grund und zeigen welche Skills dahinterstecken.
Webanalyse steht für Messbarkeit und ist die Grundlage für langfristige Erfolgskontrolle und Effizienzsteigerung Ihrer (Online) Marketing Aktivitäten.
Mehr ErfahrenData Science entwickelte sich aus der statistischen Modellierung und Datenanalyse und ist stark in Disziplinen wie Mathematik, Statistik, Advanced Analysis und Machine Learning verwurzelt. Das interdisziplinäre Feld nutzt wissenschaftlich fundierte Methoden, Prozesse, Algorithmen und Systeme zur Extraktion von Erkenntnissen, Mustern und Schlüssen sowohl aus strukturierten als auch aus unstrukturierten Daten.
Data Science ist fokussiert auf das Extrahieren von nützlichen Informationen aus Datensätzen!
Die / der Data Scientist übersetzt wirtschaftliche Fragen in die Sprache der Informatik und Mathematik. Mittels Machine Learning und Predictive Analysis werden aus zusammengesetzten Datensätzen nützliche Informationen extrahiert. Die Aussagen dienen als Erkenntnisse bzw. Vorhersagen und sind Entscheidungshilfe oder -grundlage für wichtige unternehmerische Fragestellungen.
Data Scientists sind in der Welt der Statistik, Wahrscheinlichkeitsrechnung, Mathematik und Algorithmen zuhause. Um Programme zu trainieren, und Analysen zu erstellen sind Programmierkenntnisse notwendig. Eine verbreitete Programmiersprache in Data Science ist “R” welche für statistische Berechnungen entwickelt wurde.
Die Merkmale einer / eines Data Scientists sind vielfältig. Dazu gehören jedenfalls:
Data Scientists müssen nicht zwingend aus der IT oder Informatik kommen! Naturwissenschaftliche Fachbereiche wie zB Chemie, Physik, Meeresbiologie usw. sind optimal, da das Mindset der Forschung auch auf Data Science anwenden lässt.
Data Engineering gilt als Teilbereich von Data Science. Die grundsätzlichen Aufgaben von Data Engineering sind das Sammeln, Aufbereiten und Validieren von Daten.
Data Engineers stehen vor der Herausforderung, Daten sowohl aus strukturierten als auch unstrukturierten Systemen auf fehlende Felder, mismatched Datentypen und andere Daten-relevante Probleme zu überprüfen und die Daten zu bereinigen. Anders als bei den Data Scientists, haben Data Engineers typischerweise einen Programmier-Background, meistens in Java, Scala oder Python.
Die Programmierkenntnisse werden genutzt, um Daten zu bereinigen und an ein System zu übergeben. Diese Daten ermöglichen es dem Data Scientist dann, Analysen und Hypothesen zu erstellen, sowie Datenmodelle anzuwenden.
Data Engineers designen, entwerfen und arrangieren Daten zur weiteren Analyse.
Damit sind Data Scientists kontinuierlich mit der Dateninfrastruktur beschäftigt, aber nicht für den Aufbau und die Instandhaltung dieser Infrastruktur verantwortlich – diese Verantwortung fällt in den Aufgabenbereich der Data Engineers. Diese bilden skalierbare, höchst leistungsfähige Infrastrukturen, welche Business Insights durch Rohdaten-Quellen ermöglichen. Sie implementieren damit komplexe analytische Projekte mit dem Fokus, dass diese Daten in weiterer Folge von Data Scientists aufgegriffen werden können.
Data Scientists beschäftigen sich mit Analysetechniken wie R, SPSS, Hadoop, und fortgeschrittenen statistischen Modellen. Data Engineers hingegen fokussieren sich auf Produkte die die Anwendung dieser Techniken ermöglichen – bspw. SQL, MySQL, NoSQL, Cassandra, und weitere Services zum Organisieren von Daten.
Beide Skillsets sind notwendig und bilden damit ein Data-Team, dass die Arbeit mit “Big Data” ermöglicht.
Um diese Lücke (s. Bild oben) zwischen dem akademischen Mindset und dem Need etwas Handfestes herzustellen zu füllen, entwickelt sich zurzeit ein neuer Typus von Engineers. Dieser ist meist in den USA vorzufinden. Der Titel dieser Profession lautet: Machine Learning Engineer.
Machine Learning Engineers kommen meist aus einem Data Engineering Background. Sie kennen sowohl die Welt der Data Scientists, als auch die der Data Engineers und können Kenntnisse beider Bereiche vorweisen. Damit ist ein Machine Learning Engineer die verbindende Position zwischen Data Science und Data Engineering.
Die Aufgabe von Machine Learning Engineers besteht darin, die Erkenntnisse von Data Scientists zu verwenden und damit etwas Handfestes umzusetzen bzw. zu produzieren. Ein Machine Learning Engineer hat genug Engineering Kenntnisse, um hier anzusetzen und den letzten Schritt des Projekts zu verwirklichen.
Aus Data Engineers können Machine Learning Engineers werden, allerdings braucht diese Entwicklung Zeit. Außerdem benötigen sie relevante Mathematik und Statistik-Kenntnisse und Erfahrung.
Data Architekten haben die Aufgabe Ordnung in das Datenchaos zu bringen. Dazu designen Data Architekten eine Art “Blueprint” für das Daten Management von Organisationen und Unternehmen. Jedes Data Science Team benötigt einen Data Architekten zum Visualisieren, Designen und Vorbereiten eines Daten Frameworks, das dann in weiterer Folge von Data Scientists, Engineers oder Data/Web Analysten genutzt werden kann.
Data Engineers unterstützten Data Architects beim Bilden eines Frameworks für Data Search und Datenabfragen, welche Data Scientists und Analysten dann weiter für ihre Arbeit nutzen können.
Die größten Unterschiede zwischen Data Architekten und Data Engineers sind:
Cloud Engineers sind dafür verantwortlich, Business Infrastrukturen und diverse Funktionen in Cloud-basierte Systeme zu migrieren. Sie erstellen, verwalten und verlinken Cloud Services und verbinden sowohl technische Skills als auch Business-Wissen und Erfahrungen mit mindestens einem großen Cloud Provider, wie etwa: Amazon Web Services, Microsoft Azure und Google Cloud Platform.
Sie beurteilen existierende Infrastrukturen und suchen nach Lösungen und setzen unterschiedliche Funktionen ( wie etwa die Database Storage) in Cloud-basierten Systemen um. Dafür benötigen sie neben technischen Skills, auch die Fähigkeit Vertragsbedingungen mit Anbietern zu verhandeln, die Sicherheit von Daten zu gewährleisten und neue Praktiken in einem Prozess zu implementieren.
Ein Cloud Architekt ist eine IT-Fachperson, die verantwortlich für die gesamte Unternehmens-Cloud-Computing- Strategie ist. Dazu gehören Tasks wie die Cloud-Einführung, Cloud Application Design sowie Cloud Management und Monitoring. Zudem sind sie Consultants und müssen auf dem neusten Stand über die Entwicklungen in ihrem Bereich bleiben.
Sie möchten Teil unseres Data Teams werden oder sind interessiert an den vielseitigen Einsatzmöglichkeiten von Data Science & Machine Learning in Ihrem Unternehmen? Werfen Sie einen Blick auf unsere Jobseite.
Wir freuen uns auf Ihre Anfrage und beraten Sie gerne unverbindlich! Füllen Sie dazu einfach das Kontaktformular aus oder rufen uns direkt an.
Jetzt kontaktierenNewsletter
Holen Sie sich unsere Online Marketing-Insights und Trends direkt in Ihr Postfach!