TDWI Konferenz 2020

München, 26. – 28. Oktober 2020

Sessionsdetails

Vortrag: Mi 5.1
Datum: Mi, 28.10.2020
Uhrzeit: 09:00 - 12:30
cart

Modernes Text Mining mit Python und PowerBI

Uhrzeit: 09:00 - 12:30
Vortrag: Mi 5.1

 

Die systematische Nutzung von Freitexten bietet ein großes Potenzial für die Gewinnung neuer Erkenntnisse oder die Automatisierung von Prozessen, das Unternehmen verstärkt nutzen wollen. Der Workshop soll Datenanalysten den Einstieg in das Text Mining erleichtern. Anhang konkreter Anwendungsbeispiele werden die nötigen Schritte und aktuelle Analyse- und maschinelle Lernverfahren erläutert. Für Datenvorbereitung und das Mining wird dabei Python genutzt, die Auswertung und Visualisierung der Ergebnisse erfolgt mit PowerBI.

Zielpublikum: Data Engineers, Data Analysts, Project Leaders
Voraussetzungen: Grundlegendes Verständnis von Data Mining / Machine Learning sowie elementare Programmierkenntnisse (nicht notwendigerweise in Python) werden vorausgesetzt. Zum Mitmachen sollten Python (Anaconda + zusätzlich spaCy) sowie PowerBI auf dem Laptop installiert sein
Schwierigkeitsgrad: Fortgeschritten

Extended Abstract
Die analytische Erschließung von Texten ist für viele Unternehmen der erste Schritt in die Welt unstrukturierter Daten. Die Anwendungsgebiete sind vielfältig und reichen von der Auswertung von Kunden-Kommunikation für Marketing-Zwecke bis zum automatisierten Routing von Dokumenten oder der Priorisierung von Service-Requests.

Im Workshop wird anhand von Fallballspielen durchgespielt, wie ausgehend von einer Fragestellung ein Modell erstellt, evaluiert und visualisiert werden kann. Dabei wird gezeigt,

  • wie Datenvorbereitung mit modernen NLP-Bibliotheken wie spaCy funktioniert
  • wie sich schnell und elegant statistische Analysen auf den aufbereiteten Daten in Python und PowerBI umsetzen lassen
  • wie aus Texten Feature-Vektoren erzeugt werden
  • wie mit maschinellen Lernverfahren Texte klassifiziert und gruppiert werden können
  • wie die Stärken und Schwächen der Modelle mit PowerBI transparent gemacht werden können
  • wie Anwender selbst mit den Ergebnissen in PowerBI arbeiten können.

Am Ende werden Sie ein solides Grundverständnis davon haben, wie der Analyse-Prozess abläuft, welche Potenziale sich bieten und welche Fallstricke dabei lauern.

 

Sponsoren TDWI München 2020

  • Ab Initio Software Germany GmbH Platinsponsor
  • Adastra GmbH Platinsponsor
  • Denodo Technologies Platinsponsor
  • Exasol Platinsponsor
  • INFOMOTION GmbH Platinsponsor
  • itelligence AG Platinsponsor
  • NTT DATA Deutschland Platinsponsor
  • pmOne Group Platinsponsor
  • Qlik Platinsponsor
  • SAP Deutschland SE & Co. KG Platinsponsor
  • Sopra Steria Platinsponsor
  • Talend Germany GmbH Platinsponsor
  • Teradata GmbH Platinsponsor
  • 2150 GmbH | Distilling business insight. Goldsponsor
  • adesso AG Goldsponsor
  • BE-terna GmbH Deutschland Goldsponsor
  • blueforte GmbH Goldsponsor
  • CIMACON GmbH Goldsponsor
  • Confluent Goldsponsor
  • EVACO GmbH Goldsponsor
  • heureka e-Business GmbH Goldsponsor
  • infologistix GmbH Goldsponsor
  • INFORM DataLab Goldsponsor
  • INFORMATION WORKS GmbH Goldsponsor
  • Marmeladenbaum GmbH Goldsponsor
  • OPITZ CONSULTING Goldsponsor
  • PROCON IT AG Goldsponsor
  • SYCOR GmbH Goldsponsor
  • Syncwork AG Goldsponsor
  • Vertica Goldsponsor
  • Alligator Company Silbersponsor
  • AnalyticsCreator Solutions GmbH Silbersponsor
  • areto consulting GmbH Silbersponsor
  • Axians IT Solutions GmbH Silbersponsor
  • bluetelligence GmbH Silbersponsor
  • BSgroup Data Analytics AG Silbersponsor
  • cimt ag Silbersponsor
  • Data Insights GmbH Silbersponsor
  • DataMerlin Silbersponsor
  • dataspot GmbH Silbersponsor
  • Disy Informationssysteme GmbH Silbersponsor
  • DWH42 Silbersponsor
  • Genesee Academy Silbersponsor
  • graphomate GmbH Silbersponsor
  • m2data Silbersponsor
  • PRODATO Integration Technology GmbH Silbersponsor
  • QuinScape GmbH Silbersponsor
  • saracus consulting GmbH Silbersponsor
  • Solecon Silbersponsor
  • sonra Silbersponsor
  • Data Reasons Start-Up