Definitionen

Data Science ... Definitionen

Extraktion von Wissen aus (validen) Daten

Data Science ... was verstehen wir darunter?

Es existieren eine Reihe von Definitionen für den Begriff „Data Science“. Obwohl es diesen Begriff in der wissenschaftlichen Welt bereits seit ca. 50 Jahren gibt, wird Data Science erst seit kurzem als eine der Schlüsseldisziplinen unserer Zeit angesehen. Demnach wird die Disziplin, die früher sehr allgemein als „Extraktion von Wissen aus Daten“ definiert wurde, momentan sehr stark mit neueren innovativen Ansätzen aus den Bereichen des Maschinellen Lernens und der Künstlichen Intelligenz in Verbindung gebracht. Unternehmen verbinden mit Data Science häufig Methoden aus dem Bereich Business Intelligence oder Business Analytics, die sich mehr mit einer zweckorientierten Datenanalyse beschäftigen und im Bereich Entscheidungsunterstützung eingesetzt werden.

[1] definiert Data Science als ein Gebiet, das Wissen in Statistik, Hard- und Software sowie Anwendungsdomänen umfasst.

[2] sieht die Verbindung von Data Science in der Wissenschaft mit unterschiedlichen Teilbereichen verschiedener akademischer Disziplinen: Informatik, Statistik, Mathematik, Natur- oder Wirtschaftswissenschaften, einschließlich des Maschinellen Lernens, des Statistischen Lernens, der Programmierung, der Datentechnik, der Mustererkennung, der Prognostik, der Modellierung von Unsicherheiten und der Datenlagerung.

[3] beschreibt Data Science als eine Disziplin, die sich mit der Art und Weise, wie Big Data erhoben, verarbeitet, aufbereitet und analysiert werden, beschäftigt.

[4] liefert folgende detaillierte wissenschaftliche Definition, die oft als Grundlage für wiss. Arbeiten herangezogen wird ...

„Data science is an interdisciplinary field aiming to turn data into real value. Data may be structured or unstructured, big or small, static or streaming. Value may be provided in the form of predictions, automated decisions, models learned from data, or any type of data visualization delivering insights. Data science includes data extraction, data preparation, data exploration, data transformation, storage and retrieval, computing infrastructures, various types of mining and learning, presentation of explanations and predictions, and the exploitation of results taking into account ethical, social, legal, and business aspects.”

[1] – [4] siehe Quellen und Referenzen

 

Data Science Relevanz