Data Science ist ein interdisziplinäres Fachgebiet, das sich mit der Extraktion von Erkenntnissen, Mustern und entscheidungsunterstützenden Informationen durch die Anwendung systematischer Methoden der Mathematik und Informatik aus den Daten und Prozessen der zu untersuchenden Fachdomäne beschäftigt. Das "The Data Science Venn Diagram“ von Drew Conway zeigt genau diese Verbindung der unterschiedlichen Bereiche.
"The Data Science Venn Diagram“ von Drew Conway
Eine Möglichkeit der Beschreibung von Vorgehen und Prozessen aus dem Bereich Data Science bieten Darstellungen von sog. Lebenszyklen. Industrie und Wissenschaft beschäftigen sich viel mit möglichen Visualisierungen von solchen Lebenszyklen, dementsprechend existieren zurzeit viele Darstellungen mit unterschiedlicher Anzahl, Reihenfolge und Definition der einzelnen Schritte im Zyklus.
Team Data Science Process, aus Microsoft, 2017
Basierend auf den diversen Abbildungen und Definitionen aus diesem Bereich können folgende Kernkomponenten der Data Science abgeleitet werden ...
- Daten
- Analysemethoden
- Domänenwissen
- Vorgehensmodell
- Visualisierung
- Verwertung