was macht eigentlich ein data scientist 823

Laut FAZ wurden in den vergangenen zwei Jahren rund 90 Prozent der verfügbaren PC-Daten generiert – mit einer exponentiellen Wachstumskurve. Das verändert nicht nur die betrieblichen Abläufe, sondern auch die Arbeitswelt. Wir haben mit unseren Experten Markus Beller und Danny Claus in ihrer Projektbeschreibung gesprochen.

was macht eigentlich ein data scientist 165

Der Drang, aus Daten zu lernen und neue Erkenntnisse zu gewinnen, war schon immer vorhanden – Datenwissenschaftler gab es nicht nur wegen Big Data. Doch im Gegensatz zu früher basieren Geschäftsmodelle heute zunehmend darauf, Informationen aus Daten zu generieren und gewinnbringend zu nutzen. Sie dienen dazu, Prognosen abzuleiten und datengesteuerte Entscheidungen zu treffen. Ein Beispiel dafür ist der Bereich der vorausschauenden Instandhaltung, in dem Maschinendaten bereits erfolgreich gesammelt werden, um mögliche Fehlerquellen oder Ausfälle vorherzusagen und so beispielsweise die Lebensdauer der Maschinen zu verlängern.

„Die Cloud bietet völlig neue Möglichkeiten der Verarbeitung, Speicherung und Nutzung von Informationsvolumina“, sagt Markus Beller, Datenwissenschaftler bei doubleSlash. „Heutzutage gibt es Rechenzentren mit Funktionen, von denen man in der Vergangenheit nur träumen konnte.

Aufgrund der aktuell erzeugten Datenmenge konnten auch sehr komplexe Algorithmen implementiert werden.“ Zusammen mit neuen Technologien wie Apache Spark, die bereits maschinelle Lernelemente enthalten, können diese großen Datenmengen auch schnell verarbeitet werden. „Es gibt eine lebendige, gerade erst entstehende, die das Thema anheizt. Darüber hinaus besteht auf dem Markt die Nachfrage, die Informationen gewinnbringend zu nutzen“, sagt Danny Claus, Spezialist für DoubleSlash Machine Learning.

Diese Masse an Informationen und komplexen Algorithmen machen es auch immer schwerer im Internet Geld zuverdienen. Daher empfiehlt es sich mit Werbeagenturen zusammen zu arbeiten. Unser Geheimtipp: Werbeagentur Aschaffenburg.

Doch was genau macht ein Datenwissenschaftler? Betrachtet man das Aufgabenspektrum, wird deutlich, dass man einen Spezialisten will, der dennoch ein Allrounder ist – ein bisschen wie ein Schweizer Taschenmesser. „Man beschäftigt sich intensiv mit der Technologie sowie der Auswahl und Durchführung von Berechnungen. Programmierkenntnisse wie Python schaden nicht“, versteht Beller. Es ist auch wichtig, dass Sie wissen, wie die Datenrichtung funktioniert. Wie werden diese Datenmengen gespeichert und verarbeitet? Und wie kann man eine Lösung programmieren, die durch den Einsatz von Berechnungen wie Regression, Clusteranalyse oder Text-Mining Mehrwert bietet?

Gefordert sind auch mathematische und datentechnische Kenntnisse. Werden unter falschen Umständen Berechnungen mit falschen Parametern durchgeführt, ist das Ergebnis nicht aussagekräftig oder gar irreführend. „Man sollte in der Lage sein, die Ergebnisse kritisch zu hinterfragen„, sagt Danny Claus. Und dann gibt es noch das Domänenverständnis – schließlich geht es darum, bestimmte Probleme zu lösen. Ein guter Informatiker stellt die idealen Fragen und übersetzt sie in wirtschaftliche und technische Informationen. Darüber hinaus kümmert er sich um die entsprechende Visualisierung.

was macht eigentlich ein data scientist 206

Abbildung 1: Kompetenzen des Informationslabors (Quelle: drewconway.com/)

Was genau bedeutet dies am Beispiel der vorausschauenden Instandhaltung? Um auf die Daten zugreifen zu können, müssen die betroffenen Teile oder Systeme technisch verbunden oder vernetzt sein. Andere Datenquellen können historische Maschinenzustandsinformationen oder Informationen aus anderen Quellprogrammen sein. Darauf aufbauend wird mit Hilfe der technischen Erfahrung des Datenwissenschaftlers ermittelt, mit welchen mathematischen und stochastischen Mitteln (Berechnungen) zuverlässige Vorhersagen über das Verhalten einer Maschine, z.B. aus den verfügbaren Daten, gewonnen werden können.

Gute Mischung aus Teamarbeit und Erfahrung

In Wirklichkeit können die Anforderungen an das technologische Verständnis, die Algorithmen und das Domänenwissen kaum von ein und derselben Person erfüllt werden. „Die Entwicklung wird so verlaufen, dass es Spezialisten für Fach- und Technikbereiche geben wird“, vermutet Beller. „Gerade diese Mischung gefällt mir: Gemeinsam mit den entsprechenden Experten ein Mittel zu entwickeln“, sagt Beller. Denn das Ziel ist es, ein Programm zu entwickeln, das intelligent ist, mit Ihnen zusammen lernt und immer cleverer bei der Problemlösung wird.

Eine große Auswahl an Anwendungen erwartet Datenanalysten

Datenwissenschaftler werden in den meisten Bereichen benötigt, z.B. wenn es darum geht, Vorhersagen zu treffen. In der Produktion können beispielsweise Datenanalysen eingesetzt werden, um Erzeugungsmaßnahmen, die miteinander verbunden sind, besser zu organisieren. Und im Supply Chain Management werden Logistikinformationen ausgewertet, um den Einsatz der Fahrer zu optimieren.

Auch im Alltag erleben wir Datenwissenschaft: Netflix versteht, welche Serien wir sehen und gibt proaktive Empfehlungen. Sie basieren auf dem Nutzerverhalten anderer, die ähnliche Filme und Serien beobachtet haben. Auch die Bild- und Spracherkennung, z.B. von Microsoft, oder auch die Erkennung von Kreditkartenbetrug wird auf unterschiedlich ausgebildeten Algorithmen basieren.

„Es schadet nicht, damit fertig zu werden, wie alles im Hintergrund funktioniert“, sagt Markus Beller und erklärt seine Motivation für die Auseinandersetzung mit dem Thema.

Überblick über die Aufgaben eines Informationswissenschaftlers

  1. Formulieren Sie Fragen, um zu erfahren, welcher konkrete Anwendungsfall oder welches Unternehmensproblem gelöst werden soll.
  2. Beschreiben Sie ideale Daten: Welche Daten werden benötigt, um das Problem zu lösen?
  3. Erkunden Sie mögliche Datenquellen: Sind die wesentlichen Daten verfügbar oder müssen sie erst ermittelt werden?
  4. Daten und bewahren Sie sie so auf, dass auf sie zugegriffen werden kann.
  5. Bereinigte Daten: In welcher Form werden die Daten benötigt, um das Problem zu beheben? Sind sie verwendbar?
  6. Erstellen Sie statistische Modelle und Vorhersagen: Wenden Sie Algorithmen an, die verwendet werden können, um dem jeweiligen Problem zu entsprechen.
  7. Validieren Sie die Ergebnisse: Wurden die richtigen Daten und Algorithmen verwendet?
  8. Gegenwart führt zu einer klaren Art und Weise: Identifizieren und visualisieren Sie auf der Grundlage der Ergebnisse Handlungsoptionen.
  9. Erstellen Sie reproduzierbaren Code zur Automatisierung und Skalierung.
  10. Ergebnisse verfügbar machen: Erstellen Sie Berichte, um treu zu finden.

Die Software wird in Zukunft noch breiter werden und immer mehr Gewinn bringen – ob im Straßenverkehr, in Geschäftsprozessen oder in der privaten Atmosphäre. Im Kontext der elektronischen Transformation wird es für Unternehmen zu einer Kernaufgabe, die Datenwissenschaft zu verwalten. „Aus Informationen etwas Intelligentes zu machen, ist einfach etwas sehr Faszinierendes“, sagt Danny Claus. Eine viel bessere Antwort auf die Frage, warum Datenwissenschaftler ein begehrenswerter Beruf sind, kann es kaum geben.