CONFERENCE PROGRAM OF 2022

Please note:
On this site, there is only displayed the English speaking sessions of the TDWI München digital. You can find all conference sessions, including the German speaking ones, here.

The times given in the conference program of TDWI München digital correspond to Central European Time (CET).

By clicking on "EVENT MERKEN" within the lecture descriptions you can arrange your own schedule. You can view your schedule at any time using the icon in the upper right corner.

ROOM E101/102 | Von CRISP-DM zu DASC-PM: Vorgehensmodelle für Data-Science

Vielfach wird als Vorgehensmodell in Data-Science-Projekten CRISP-DM herangezogen. Dabei handelt es sich um ein Modell, das über 20 Jahre alt ist, nicht mehr weiterentwickelt wird und aus einer Zeit stammt, die weit vor Big Data lag.

Im Beitrag werden einige der in der Data Science eingesetzten Vorgehensmodelle ausgehend von CRISP-DM vorgestellt. Dabei werden generelle Anforderungen an solche Modelle formuliert und mit dem DASC-PM ein neuer Ansatz vorgestellt, der die aktuellen Herausforderungen datengetriebener Projekte zu adressieren versucht.

Zielpublikum: Sämtliche Personengruppen, die an Data-Science-Projekten beteiligt sind oder den Einsatz von Data Science im Unternehmen planen
Voraussetzungen: Teilnehmer:innen sollten idealerweise erste Erfahrungen mit Data-Science-Projekten gesammelt haben
Schwierigkeitsgrad: Einsteiger

Extended Abstract:
Der Siegeszug von Data Science in den Unternehmen hält weiterhin an und ein Ende ist derzeit noch nicht absehbar. Immer mehr Unternehmen bauen Data-Science-Teams auf und integrieren Data Science in ihre Wertschöpfungskette. Dabei gilt es, verschiedene organisatorische Fragen zu klären, soll die Nutzung der entwickelten Modelle in der Produktion effizient gelingen. Eine wichtige Frage stellt dabei das Vorgehensmodell dar, an dem sich das Data-Science-Team orientiert. Vielfach wird hier ein Modell herangezogen, das über 20 Jahre alt ist, nicht mehr weiterentwickelt wird und aus einer Zeit stammt, die weit vor Big Data lag: der Cross Industry Standard Process for Data Mining (CRISP-DM). In den 1990er-Jahren für Data Mining-Projekte entwickelt, dominiert CRISP-DM noch heute den Bereich der in der Data Science Community eingesetzten Vorgehensmodelle (vgl. u.a. www.datascience-pm.com/crisp-dm-still-most-popular).  

In dem Beitrag soll zunächst die historische Entwicklung der in der Data Science eingesetzten Vorgehensmodelle nachvollzogen werden. Neben dem KDD-Prozess (Knowledge Discovery in Databases) und natürlich CRISP-DM werden auch die Foundational Methodology for Data Science (FMDS) von IBM und der Team Data Science Process (TDSP) von Microsoft kurz vorgestellt. Als Beispiel für eine Anpassung von CRISP-DM an die Welt des Machine Learning und der Data Science wird darüber hinaus das CRISP-ML(Q) diskutiert.

Anschließend werden generelle Anforderungen an ein Data-Science-Vorgehensmodell formuliert. Auf welche Besonderheiten sollte hier geachtet werden und wo muss und sollte ein solches Modell über den Klassiker CRISP-DM hinausgehen? Angesichts der rasanten Entwicklung und Verbreitung von Data Science haben sich in der Praxis weitere Anforderungen ergeben, die nun Eingang in neue Konzepte finden sollten.

Seit 2019 arbeitet eine Gruppe von Wissenschaftler:innen und Mitarbeiter:innen verschiedener Unternehmen an einem neuen Konzept. Mit DASC-PM (DAta SCience - Process Modell) wird ein noch junger Ansatz für ein Vorgehensmodell vorgestellt, in dem CRISP-DM zu einem vollwertigen Vorgehensmodell für Data Science ausgebaut wird. Neben dem Prozessmodell umfasst DASC-PM eine Zuordnung der Aufgaben im Rahmen der verschiedenen Arbeitsschritte, ein Rollenkonzept, eine Bestimmung der jeweils notwendigen Skills sowie eine Betrachtung der Schnittstellen. Daraus ergibt sich ein ganzheitliches Modell, das es Data-Science-Teams ermöglicht, ein effektives und effizientes Vorgehen zu etablieren. Dabei ist DASC-PM so generisch angelegt, dass es sowohl im Bereich Scientific Data Science, also im Forschungsumfeld, als auch im Bereich Applied Data Science, beispielsweise im unternehmerischen Umfeld, eingesetzt werden kann.  

Der Vortrag zeigt den aktuellen Stand von DASC-PM und gibt einen Ausblick, wie das Vorgehensmodell in den nächsten Schritten weiter ausgebaut werden soll.  

Im letzten Teil des Beitrags werden anhand kurzer Case Studies Einsatzmöglichkeiten von DASC-PM präsentiert. Dabei soll die Nutzung von DASC-PM in unterschiedlichen Unternehmenstypen betrachtet werden.

Verschiedene Branchen werden ebenso herangezogen wie der Einsatz in unterschiedlichen Unternehmensgrößen. 

Prof. Dr. Uwe Haneke ist seit 2003 Professor für Betriebswirtschaftslehre und betriebliche Informationssysteme an der Hochschule Karlsruhe (HKA). Dort vertritt er u. a. die Bereiche Business Intelligence und Projektmanagement im Fachgebiet Informatik. Den Bachelor Studiengang 'Data Science' an der HKA hat er maßgeblich mitgestaltet. Seine Publikationen beschäftigen sich mit den Themen Open Source Business Intelligence, Data Science, Self-Service-BI und Analytics.

Prof. Dr. Michael Schulz hält eine Professur für Wirtschaftsinformatik, insb. analytische Informationssysteme an der NORDAKADEMIE - Hochschule der Wirtschaft in Elmshorn und ist Studiengangsleiter des Master-Studiengangs 'Applied Data Science'. Seine Interessenschwerpunkte in Lehre, Forschung und Praxisprojekten liegen in der Business Intelligence und der Data Science. Er ist einer der Autoren des DASC-PM-Konzeptes.

Uwe Haneke, Michael Schulz
09:00 - 10:15
Vortrag: Di 5.1

Vortrag Teilen