CONFERENCE PROGRAM OF 2021

Please note:
On this site, there is only displayed the English speaking sessions of the TDWI München digital. You can find all conference sessions, including the German speaking ones, here.

The times given in the conference program of TDWI München digital correspond to Central European Time (CET).

By clicking on "EVENT MERKEN" within the lecture descriptions you can arrange your own schedule. You can view your schedule at any time using the icon in the upper right corner.

Text Mining mit Python und PowerBI

Die systematische Nutzung von Freitexten bietet ein großes Potenzial für die Gewinnung neuer Erkenntnisse oder die Automatisierung von Prozessen, das Unternehmen verstärkt nutzen wollen. Der Workshop soll Datenanalysten den Einstieg in das Text Mining erleichtern. Anhang konkreter Anwendungsbeispiele werden die nötigen Schritte und aktuelle Analyse- und maschinelle Lernverfahren erläutert. Für Datenvorbereitung und das Mining wird dabei Python genutzt, die Auswertung und Visualisierung der Ergebnisse erfolgt mit PowerBI.

Zielpublikum: Data Engineers, Data Analysts, Project Leaders
Voraussetzungen: Grundlegendes Verständnis von Data Mining/Machine Learning sowie elementare Programmierkenntnisse (nicht notwendigerweise in Python) werden vorausgesetzt. Zum Mitmachen sollten Python (Anaconda + zusätzlich spaCy) sowie PowerBI auf dem Laptop installiert sein.
Schwierigkeitsgrad: Fortgeschritten

Extended Abstract:
Die analytische Erschließung von Texten ist für viele Unternehmen der erste Schritt in die Welt unstrukturierter Daten. Die Anwendungsgebiete sind vielfältig und reichen von der Auswertung von Kunden-Kommunikation für Marketing-Zwecke bis zum automatisierten Routing von Dokumenten oder der Priorisierung von Service-Requests.

Im Workshop wird anhand von Fallballspielen durchgespielt, wie ausgehend von einer Fragestellung ein Modell erstellt, evaluiert und visualisiert werden kann. Dabei wird gezeigt,

- wie Datenvorbereitung mit modernen NLP-Bibliotheken wie spaCy funktioniert

- wie sich schnell und elegant statistische Analysen auf den aufbereiteten Daten in Python und PowerBI umsetzen lassen

- wie aus Texten Feature-Vektoren erzeugt werden

- wie mit maschinellen Lernverfahren Texte klassifiziert und gruppiert werden können

- wie die Stärken und Schwächen der Modelle mit PowerBI transparent gemacht werden können

- wie Anwender selbst mit den Ergebnissen in PowerBI arbeiten können.

Am Ende werden Sie ein solides Grundverständnis davon haben, wie der Analyse-Prozess abläuft, welche Potenziale sich bieten und welche Fallstricke dabei lauern.

Roland Zimmermann

Technische Hochschule Nürnberg
Professor, Data Scientist, Analytic Architect

Prof. Dr. Roland Zimmermann lehrt als Professor an der TH Nürnberg Datenkompetenz, Business Intelligence und Information Design sowie angewandte Künstliche Intelligenz. Sein aktueller Forschungsschwerpunkt liegt im Bereich Wissensgraphen und Natural-Language-Processing für das Technologie- und Innovationsmanagement. Daneben berät er beim Aufbau wirksamer analytischer Lösungen als Architekt.

Jens Albrecht

Technische Hochschule Nürnberg
Professor, Data Scientist, Analytic Architect

Prof. Dr. Jens Albrecht ist an der TH Nürnberg für die Themengebiete Datenbanken und Big Data verantwortlich. Kürzlich hat er zusammen mit zwei Co-Autoren aus der Industrie das Buch 'Blueprints for Text Analytics Using Python' veröffentlicht. Neben seiner Hochschultätigkeit ist als Trainer, Data Scientist und Daten-Architekt engagiert.

Roland Zimmermann, Jens Albrecht

Track: Workshop

16:00 - 18:10

Vortrag: Mo 5.5

Vortrag Teilen