PROGRAMM

Die im Konferenzprogramm der TDWI München 2022 angegebenen Uhrzeiten entsprechen der Central European Time (CET).

Per Klick auf "VORTRAG MERKEN" innerhalb der Vortragsbeschreibungen können Sie sich Ihren eigenen Zeitplan zusammenstellen. Sie können diesen über das Symbol in der rechten oberen Ecke jederzeit einsehen.

 

Hier können Sie die Programmübersicht der TDWI München 2022 mit einem Klick als PDF herunterladen.

ROOM E101/102 | Von CRISP-DM zu DASC-PM: Vorgehensmodelle für Data-Science

Vielfach wird als Vorgehensmodell in Data-Science-Projekten CRISP-DM herangezogen. Dabei handelt es sich um ein Modell, das über 20 Jahre alt ist, nicht mehr weiterentwickelt wird und aus einer Zeit stammt, die weit vor Big Data lag.

Im Beitrag werden einige der in der Data Science eingesetzten Vorgehensmodelle ausgehend von CRISP-DM vorgestellt. Dabei werden generelle Anforderungen an solche Modelle formuliert und mit dem DASC-PM ein neuer Ansatz vorgestellt, der die aktuellen Herausforderungen datengetriebener Projekte zu adressieren versucht.

Zielpublikum: Sämtliche Personengruppen, die an Data-Science-Projekten beteiligt sind oder den Einsatz von Data Science im Unternehmen planen
Voraussetzungen: Teilnehmer:innen sollten idealerweise erste Erfahrungen mit Data-Science-Projekten gesammelt haben
Schwierigkeitsgrad: Einsteiger

Extended Abstract:
Der Siegeszug von Data Science in den Unternehmen hält weiterhin an und ein Ende ist derzeit noch nicht absehbar. Immer mehr Unternehmen bauen Data-Science-Teams auf und integrieren Data Science in ihre Wertschöpfungskette. Dabei gilt es, verschiedene organisatorische Fragen zu klären, soll die Nutzung der entwickelten Modelle in der Produktion effizient gelingen. Eine wichtige Frage stellt dabei das Vorgehensmodell dar, an dem sich das Data-Science-Team orientiert. Vielfach wird hier ein Modell herangezogen, das über 20 Jahre alt ist, nicht mehr weiterentwickelt wird und aus einer Zeit stammt, die weit vor Big Data lag: der Cross Industry Standard Process for Data Mining (CRISP-DM). In den 1990er-Jahren für Data Mining-Projekte entwickelt, dominiert CRISP-DM noch heute den Bereich der in der Data Science Community eingesetzten Vorgehensmodelle (vgl. u.a. www.datascience-pm.com/crisp-dm-still-most-popular).  

In dem Beitrag soll zunächst die historische Entwicklung der in der Data Science eingesetzten Vorgehensmodelle nachvollzogen werden. Neben dem KDD-Prozess (Knowledge Discovery in Databases) und natürlich CRISP-DM werden auch die Foundational Methodology for Data Science (FMDS) von IBM und der Team Data Science Process (TDSP) von Microsoft kurz vorgestellt. Als Beispiel für eine Anpassung von CRISP-DM an die Welt des Machine Learning und der Data Science wird darüber hinaus das CRISP-ML(Q) diskutiert.

Anschließend werden generelle Anforderungen an ein Data-Science-Vorgehensmodell formuliert. Auf welche Besonderheiten sollte hier geachtet werden und wo muss und sollte ein solches Modell über den Klassiker CRISP-DM hinausgehen? Angesichts der rasanten Entwicklung und Verbreitung von Data Science haben sich in der Praxis weitere Anforderungen ergeben, die nun Eingang in neue Konzepte finden sollten.

Seit 2019 arbeitet eine Gruppe von Wissenschaftler:innen und Mitarbeiter:innen verschiedener Unternehmen an einem neuen Konzept. Mit DASC-PM (DAta SCience - Process Modell) wird ein noch junger Ansatz für ein Vorgehensmodell vorgestellt, in dem CRISP-DM zu einem vollwertigen Vorgehensmodell für Data Science ausgebaut wird. Neben dem Prozessmodell umfasst DASC-PM eine Zuordnung der Aufgaben im Rahmen der verschiedenen Arbeitsschritte, ein Rollenkonzept, eine Bestimmung der jeweils notwendigen Skills sowie eine Betrachtung der Schnittstellen. Daraus ergibt sich ein ganzheitliches Modell, das es Data-Science-Teams ermöglicht, ein effektives und effizientes Vorgehen zu etablieren. Dabei ist DASC-PM so generisch angelegt, dass es sowohl im Bereich Scientific Data Science, also im Forschungsumfeld, als auch im Bereich Applied Data Science, beispielsweise im unternehmerischen Umfeld, eingesetzt werden kann.  

Der Vortrag zeigt den aktuellen Stand von DASC-PM und gibt einen Ausblick, wie das Vorgehensmodell in den nächsten Schritten weiter ausgebaut werden soll.  

Im letzten Teil des Beitrags werden anhand kurzer Case Studies Einsatzmöglichkeiten von DASC-PM präsentiert. Dabei soll die Nutzung von DASC-PM in unterschiedlichen Unternehmenstypen betrachtet werden.

Verschiedene Branchen werden ebenso herangezogen wie der Einsatz in unterschiedlichen Unternehmensgrößen. 

Prof. Dr. Uwe Haneke ist seit 2003 Professor für Betriebswirtschaftslehre und betriebliche Informationssysteme an der Hochschule Karlsruhe (HKA). Dort vertritt er u. a. die Bereiche Business Intelligence und Projektmanagement im Fachgebiet Informatik. Den Bachelor Studiengang 'Data Science' an der HKA hat er maßgeblich mitgestaltet. Seine Publikationen beschäftigen sich mit den Themen Open Source Business Intelligence, Data Science, Self-Service-BI und Analytics.

Prof. Dr. Michael Schulz hält eine Professur für Wirtschaftsinformatik, insb. analytische Informationssysteme an der NORDAKADEMIE - Hochschule der Wirtschaft in Elmshorn und ist Studiengangsleiter des Master-Studiengangs 'Applied Data Science'. Seine Interessenschwerpunkte in Lehre, Forschung und Praxisprojekten liegen in der Business Intelligence und der Data Science. Er ist einer der Autoren des DASC-PM-Konzeptes.

Uwe Haneke, Michael Schulz
09:00 - 10:15
Vortrag: Di 5.1

Vortrag Teilen