
Begleiten Sie uns auf dem ITGAIN-Tag auf dem Weg von den Quelldaten bis zum analytischen Modell. Wir zeigen Ihnen anhand eines Anwendungsfalls Best Practices und Hands-on-Lösungen aus Data Warehouse Automation und Analytics in hybrider Datenarchitektur – und das alles in weniger als 8 Stunden.
Wissen generieren, Entscheidungen treffen, Aktionen umsetzen – alles bei immer höherer Geschwindigkeit und immer geringerer Fehlertoleranz. Die digitale Transformation erhöht den Wettbewerbsdruck auf Unternehmen. Doch der Weg von Rohdaten zu faktenbasierten Entscheidungen kann steinig und langwierig sein. Dabei hilft die Optimierung der Entwicklungsprozesse.
Der Schlüssel: die richtige Kombination und Anwendung von agilen Methoden, Automationslösungen und neuen Technologien. So kommen Sie schneller zu Analyse und Erkenntnisgewinn.
09:00 - 10:15 Uhr: Die Autobahn zum Core DWH: von Data Discovery über das generierte Datenmodell zum ELT-Prozess
Sven Wiener, Lead Consultant, ITGAIN
Anhand unseres Business Cases aus der Versicherungswelt steigen wir in die ersten Phasen des Entwicklungsprozesses ein und präsentieren live wesentliche Features und Vorteile bei der Anwendung eines DWA-Tools.
Data Warehouse Automation (DWA) konzentriert sich auf die Optimierung mehrerer Dimensionen des Entwicklungsprozesses und des Betriebs von DWH-Lösungen. Es werden Aufgaben aus Analyse und Design über die Implementierung bis hin zu Test und Deployment adressiert. Anforderungen an Nachvollziehbarkeit und Dokumentation werden bei der Wahl des richtigen DWA-Tools erfüllt.
Key Words: Discovery, Modellierung, Historisierung, Delta-Laden, Lineage, Änderungsmanagement
10:15 - 10:45 Uhr: Pause
10:45 - 12:00 Uhr: Jenseits der Autobahn: Konzepte für Business Transformationen und automatisierten Betrieb via DevOps
Sven Wiener, Lead Consultant, ITGAIN
Mathias Hoffmann, Bereichsleiter Operational Services, ITGAIN
Aufbauend auf unserem Business Case zeigen wir die Realisierung und Einbindung von individuellen Transformationen in ein DWA-Tool, die unabdingbar sind für die Implementierung eines Business Data Vault und eines Data Mart.
Datenintegrationsprozesse in Staging Area und Core DWH sind in der Regel charakterisiert durch wiederkehrende Muster, die sich gut automatisieren lassen. Um das Potenzial von DWA zu heben, bedarf es eines durchgehenden Konzepts und Lösungen für individuelle Transformationen.
Agile Projektmethodik erfordert über die reine Entwicklung der ELT/ETL-Prozesse hinaus die schnelle und flexible Bereitstellung z.B. neuer Entwicklungs- oder Test-Umgebungen. Dabei endet die Agilität häufig bei den Datenbanken. Wir zeigen Ihnen Automatisierungsszenarien ausgehend von der System- und Datenbankbereitstellung
Key Words: Business Data Vault, Business-Transformation, DevOps und Continuous Deployment
12:15 - 13:15 Uhr: Keynote
13:15 - 14:45 Uhr Mittagspause
14:45 - 16:15 Uhr: Themen und Trends aus Texten erkennen und visualisieren – Natural Language Processing und Topic Modeling
Oliver Ilnicki, Lead Expert, ITGAIN
Timo Schulz, Lead Expert, ITGAIN
Am Beispiel eines News-Datensatzes setzen wir unsere Reise von der Quelle zur Aktion fort. Auf Basis eines realen News-Datensatzes präsentieren wir Ihnen mittels Natural Language Processing (NLP) die Aufbereitung von Texten für die weitere AI-gestützten Analyse.
Neben den strukturierten Unternehmensdaten aus dem Enterprise-DWH gewinnen unstrukturierte Daten für die Geschäftssteuerung an Bedeutung. Eine Möglichkeit ist die Datenablage in einem Hadoop Cluster, welche die Voraussetzung für eine effiziente parallele Datenaufbereitung ist.
Wir demonstrieren die Herausforderungen beim NLP und wie mittels AI-Methoden systematisch Wissen und Erkenntnisse aus unstrukturierten Texten gewonnen werden können.
Abschließend zeigen wir, wie die gewonnenen Erkenntnisse als Wissensgraph visualisiert werden können. Die daraus abgeleiteten Trends lassen sich unter anderem zur Produkt- und Strategieentwicklung nutzen.
Key Words: Hadoop, Artificial Intelligence, Textmining, Python, Topic Modeling, NLP
16:15 - 16:45 Uhr: Pause
16:45 - 18:00 Uhr: Analytics in hybrider Datenarchitektur - Konzeption und Realisierung eines Schaden-Vorhersagemodells im Data Lake
Thilo Boehnke, Lead Consult, ITGAIN
Im letzten Schritt unseres Wegs von der Quelle zur Aktion demonstrieren wir das Vorgehen, wie aus Daten der Data Lake Architektur ein Schaden-Vorhersagemodell konzipiert und realisiert wird.
Die Auswertung strukturierter Unternehmensdaten mittels AI-Methoden liefert automatisierte Entscheidungen. Die Analyse der DWH Daten gemeinsam mit unstrukturierten Daten aus einem Hadoop Cluster führt im Ergebnis zu einer weiteren Anreicherung und Aufwertung der Erkenntnisse.
Thematisiert wird die Klassifikation der historischen Daten aus dem Versicherungs-DWH und die Anreicherung der Informationen mittels Text Mining auf einem News-Datensatz.
Das genutzte Werkzeug für die Integration der einzelnen Komponenten ist die KNIME Analytics Plattform.
Key Words: Data Lake, Architektur, KNIME, Prognose, Textmining