TDWI Konferenz 2020

München, 26. – 28. Oktober 2020

Sessionsdetails

Vortrag: Mi 5.1
Datum: Mi, 24.06.2020
Uhrzeit: 09:00 - 12:30
cart

Modernes Text Mining mit Python und PowerBI

Uhrzeit: 09:00 - 12:30
Vortrag: Mi 5.1

 

Die systematische Nutzung von Freitexten bietet ein großes Potenzial für die Gewinnung neuer Erkenntnisse oder die Automatisierung von Prozessen, das Unternehmen verstärkt nutzen wollen. Der Workshop soll Datenanalysten den Einstieg in das Text Mining erleichtern. Anhang konkreter Anwendungsbeispiele werden die nötigen Schritte und aktuelle Analyse- und maschinelle Lernverfahren erläutert. Für Datenvorbereitung und das Mining wird dabei Python genutzt, die Auswertung und Visualisierung der Ergebnisse erfolgt mit PowerBI.

Zielpublikum: Data Engineers, Data Analysts, Project Leaders
Voraussetzungen: Grundlegendes Verständnis von Data Mining / Machine Learning sowie elementare Programmierkenntnisse (nicht notwendigerweise in Python) werden vorausgesetzt. Zum Mitmachen sollten Python (Anaconda + zusätzlich spaCy) sowie PowerBI auf dem Laptop installiert sein
Schwierigkeitsgrad: Fortgeschritten

Extended Abstract
Die analytische Erschließung von Texten ist für viele Unternehmen der erste Schritt in die Welt unstrukturierter Daten. Die Anwendungsgebiete sind vielfältig und reichen von der Auswertung von Kunden-Kommunikation für Marketing-Zwecke bis zum automatisierten Routing von Dokumenten oder der Priorisierung von Service-Requests.

Im Workshop wird anhand von Fallballspielen durchgespielt, wie ausgehend von einer Fragestellung ein Modell erstellt, evaluiert und visualisiert werden kann. Dabei wird gezeigt,

  • wie Datenvorbereitung mit modernen NLP-Bibliotheken wie spaCy funktioniert
  • wie sich schnell und elegant statistische Analysen auf den aufbereiteten Daten in Python und PowerBI umsetzen lassen
  • wie aus Texten Feature-Vektoren erzeugt werden
  • wie mit maschinellen Lernverfahren Texte klassifiziert und gruppiert werden können
  • wie die Stärken und Schwächen der Modelle mit PowerBI transparent gemacht werden können
  • wie Anwender selbst mit den Ergebnissen in PowerBI arbeiten können.

Am Ende werden Sie ein solides Grundverständnis davon haben, wie der Analyse-Prozess abläuft, welche Potenziale sich bieten und welche Fallstricke dabei lauern.

 

Sponsoren TDWI München 2020

  • Ab Initio Software Germany GmbH Platinsponsor
  • Adastra GmbH Platinsponsor
  • Data Virtuality GmbH Platinsponsor
  • Denodo Technologies Platinsponsor
  • Exasol Platinsponsor
  • INFOMOTION GmbH Platinsponsor
  • itelligence AG Platinsponsor
  • NTT DATA Deutschland Platinsponsor
  • pmOne Group Platinsponsor
  • Qlik Platinsponsor
  • SAP Deutschland SE & Co. KG Platinsponsor
  • Sopra Steria Platinsponsor
  • Talend Germany GmbH Platinsponsor
  • Teradata GmbH Platinsponsor
  • Trivadis GmbH Platinsponsor
  • 2150 GmbH | Distilling business insight. Goldsponsor
  • adesso AG Goldsponsor
  • Alation Goldsponsor
  • BE-terna GmbH Deutschland Goldsponsor
  • blueforte GmbH Goldsponsor
  • CIMACON GmbH Goldsponsor
  • CP Corporate Planning AG Goldsponsor
  • Dataiku Goldsponsor
  • erwin, Inc. Goldsponsor
  • EVACO GmbH Goldsponsor
  • heureka e-Business GmbH Goldsponsor
  • infologistix GmbH Goldsponsor
  • INFORM DataLab Goldsponsor
  • INFORMATION WORKS GmbH Goldsponsor
  • integration-factory GmbH & Co. KG Goldsponsor
  • Marmeladenbaum GmbH Goldsponsor
  • Neo4j Goldsponsor
  • OPITZ CONSULTING Goldsponsor
  • PROCON IT AG Goldsponsor
  • SYCOR GmbH Goldsponsor
  • Syncwork AG Goldsponsor
  • TIBCO Goldsponsor
  • Vertica Goldsponsor
  • Alligator Company Silbersponsor
  • areto consulting GmbH Silbersponsor
  • Axians IT Solutions GmbH Silbersponsor
  • biGENiUS Silbersponsor
  • bluetelligence GmbH Silbersponsor
  • BSgroup Data Analytics AG Silbersponsor
  • cimt ag Silbersponsor
  • CINTELLIC Consulting Group Silbersponsor
  • Data Insights GmbH Silbersponsor
  • DataMerlin Silbersponsor
  • dataspot GmbH Silbersponsor
  • datasqill - The Post-ETL Silbersponsor
  • Disy Informationssysteme GmbH Silbersponsor
  • DWH42 Silbersponsor
  • Genesee Academy Silbersponsor
  • graphomate GmbH Silbersponsor
  • m2data Silbersponsor
  • PRODATO Integration Technology GmbH Silbersponsor
  • QuinScape GmbH Silbersponsor
  • saracus consulting GmbH Silbersponsor
  • Solecon Silbersponsor
  • sonra Silbersponsor