
Die im Konferenzprogramm der TDWI München 2022 angegebenen Uhrzeiten entsprechen der Central European Time (CET).
Per Klick auf "VORTRAG MERKEN" innerhalb der Vortragsbeschreibungen können Sie sich Ihren eigenen Zeitplan zusammenstellen. Sie können diesen über das Symbol in der rechten oberen Ecke jederzeit einsehen.
Hier können Sie die Programmübersicht der TDWI München 2022 mit einem Klick als PDF herunterladen.
ROOM F129 | Data Vault - Codegenerierung
Der hohe Grad der Standardisierung, die einfache und einheitliche Importlogik und die klare Trennung der Schichten ermöglicht eine weitgehend automatische Erzeugung der Importlogik für ein Data Vault-Modell.
Dabei muss nicht unbedingt ein Generator gekauft werden. Man kann auch das bereits im Projekt verwendete ETL-Werkzeug, wie den Oracle Data Integrator (ODI), erweitern, um die Logik zur Beladung zu erzeugen.
Wir zeigen die Vorteile dieser Lösung für die DWH-Projekte der Norma Lebensmittelfilialbetrieb Stiftung & Co. KG.
Zielpublikum: Data Engineers, BI Project Managers, an Data Vault Interessierte
Voraussetzungen: Grundkenntnisse in Datenmodellierung und Data Warehousing sind vorteilhaft
Schwierigkeitsgrad: Einsteiger
Extended Abstract:
Nach einer kurzen Einführung in die Data Vault-Grundstrukturen (Hubs, Links, Satellites, Point-In-Time Tables, Bridges) konzentriert sich der Vortrag auf die automatisierte Generierung der Beladungslogik für die elementaren DV-Strukturen (Hubs, Links, Satellites).
Code-Generierung lohnt sich nicht nur, sie ist bei Data Vault notwendig. Die hohe Anzahl der Datenstrukturen und der damit verbundenen Ladeprozesse sind mit manueller Modellierung nur schwer zu bewältigen.
Code-Generierung dient primär der Entlastung der Entwickler von repetitiven Tätigkeiten und schafft die Voraussetzung für schnelle und agile Projekte. Darüber hinaus ist generierter Code standardisiert und hat eine einheitliche Qualität.
Am Beispiel des Oracle Data Integrators (ODI) wird gezeigt, dass mit einem eigenen Generator nicht nur SQL-Statements erzeugt werden, sondern direkt Mappings im ETL-Werkzeug, so dass kein 'Medienbruch' zur manuellen Modellierung entsteht.
Die hohe Flexibilität dieses Ansatzes ermöglicht es, dass der Generator projekt- und kundenspezifische Anforderungen realisieren kann. So wurde bei Norma ein neues Data Warehouse für den Online-Handel (Norma 24) mit einer reinen Data Vault 2.0-Ladelogik aufgebaut. Gleichzeitig wurde das bestehende dimensionale Data Warehouse für den stationären Handel um eine Data Vault-Schicht ergänzt, die sowohl Data Vault 1.0- als auch 2.0-Schlüssel generiert, um eine fließende Migration ohne Downtimes zu ermöglichen.
Markus Schneider arbeitet als Managing Consultant für das IT-Dienstleistungsunternehmen PRODATO Integration Technology GmbH. Er ist seit mehr als 15 Jahren als Berater, Software-Entwickler, Projekt-Manager und Data Warehouse Architect im Oracle-Umfeld tätig. Seine Spezialgebiete sind Datenmodellierung und ETL-Entwicklung.
Andreas Krake arbeitet als Projekt-Manager für ERP-Systeme und BI-Anwendungen bei der Firma Norma Lebensmittelfilialbetrieb seit 5,5 Jahren. Auf Grund der fast 14-jährigen Betriebszugehörigkeit mit vorangegangenen Tätigkeiten als Bereichsleiter Verkauf und im Inhouse Consulting bildet er das Bindeglied zwischen den fachlich-organisatorischen Anforderungen und der technischen Umsetzung.
Vortrag Teilen