KONFERENZPROGRAMM

100 EUR sparen bis zum 23. Mai mit Code: EARLYBIRD

Data Lakehouse: effiziente Alternative zur Cloud-Architektur

Seit 2012 nutzte die Kassenärztliche Vereinigung Westfalen-Lippe ein Datawarehouse auf Basis einer Appliance. Wegen des auslaufenden Supports und steigender Kosten wurde mit DATA MART Consulting eine neue Data-Lakehouse-Architektur gewählt und ein Migrationsplan erstellt. Innerhalb eines Jahres musste die Migration erfolgen, um die Performance für 1.000 tägliche Nutzer zu gewährleisten. Der Vortrag zeigt das Vorgehen, die Herausforderungen und den erfolgreichen Abschluss des Projekts sowie die zukünftigen Möglichkeiten des Data Lakehouse.

Zielpublikum: Data Analyst, Data Architect, Project Manager, Team Lead
Voraussetzungen: Datawarehouse/Data Lakehouse Knowledge
Schwierigkeitsgrad: Advanced

Extended Abstract:
Erfolgreiche Projektdurchführung der Modernisierung des Datawarehouse bei der KVWL.

Seit 2012 wurde sehr erfolgreich bei der Kassenärztlichen Vereinigung Westfalen-Lippe ein Datawarehouse intensiv genutzt. Dieses basierte technologisch für die Datenhaltung auf einer Microsoft Appliance (APS). Aufgrund des auslaufenden Supports für die Appliance und somit stark steigender Kosten war schnell klar, dass eine neue Lösung gefunden werden musste.

Mit Unterstützung des Lösungsanbieters DATA MART Consulting wurde eine neue Data-Lakehouse-Architektur ausgewählt, definiert und ein Migrationsplan erstellt. Das zur Verfügung stehende Zeitfenster war mit nicht einmal einem Jahr recht knapp, sodass an eine Komplettmigration aufgrund der Vielzahl der Prozesse und Berichte nicht zu denken war. Schließlich sollten die bis zu 1.000 täglichen Nutzer auch weiterhin performant auf den Datenschatz zugreifen können.

In diesem Vortrag erfahren Sie, wie das Projektvorgehen aussah, welche Herausforderungen das Projektteam bewältigen musste und wie am Ende das Projekt erfolgreich abgeschlossen werden konnte. Die Weichen für die Zukunft sind gestellt. Die Weiterentwicklung und die neuen Möglichkeiten des Data Lakehouse können nun erschlossen werden. 

Folgende Aspekte waren bei der Migration ausschlaggebend und im Vortrag wird erläutert, wie damit umgegangen wurde:

1. Evaluation der Lösungen: Cloud oder On-Premises

Die Entscheidung zwischen einer Cloud- oder On-Premises-Lösung für ein Data Lakehouse hing von verschiedenen Kriterien ab. Zu den wichtigsten Faktoren zählten die spezifischen Anforderungen der KVWL, die vorhandene IT-Infrastruktur, die Kosten und die regulatorischen Anforderungen sowie das vorhandene Know-how. 

Eine Cloud-Lösung bietet Flexibilität und Skalierbarkeit, während eine On-Premises-Lösung mehr Kontrolle und Sicherheit über die Daten und Kosten ermöglicht. 

2. Einschränkungen durch Datenschutz und sensible Informationen

Datenschutz und der Umgang mit sensiblen Informationen sind entscheidende Faktoren bei der Wahl der Architektur. Insbesondere im Gesundheitswesen gibt es strenge Datenschutzbestimmungen, die eine Speicherung und Verarbeitung von Daten in der Cloud einschränken können. Eine On-Premises-Lösung bietet hier den Vorteil, dass alle Daten innerhalb der eigenen Infrastruktur bleiben und somit besser kontrolliert werden können.

3. Kostenfaktor Cloud

Die Kosten für Cloud-Dienste können schnell ansteigen, insbesondere bei großen Datenmengen und hohen Nutzungsanforderungen. Eine vollständige Cloud-Lösung kann daher aus Kostengründen unattraktiv sein. Eine On-Premises-Lösung kann langfristig kosteneffizienter sein, da sie keine laufenden Gebühren für Cloud-Dienste verursacht.

4. Technische Architektur des On-Premises Data Lakehouse

Ein Data Lakehouse muss mit verschiedenen Komponenten realisiert werden, um den Anforderungen der Zukunftsfähigkeit und Kosteneffizienz gerecht zu werden. Im Vortrag werden die Architekturentscheidungen beleuchtet.

5. Technischer Nutzen

Ein Data Lakehouse bietet wie ein Datawarehouse eine konsequent einfache Architektur im Schichtenmodell. Dies ermöglicht eine klare Trennung der verschiedenen Datenverarbeitungsstufen und sorgt für eine hohe Flexibilität und Skalierbarkeit. Die Architektur bei der KVWL unterstützt große Datenvolumina (> 10 TB), um eine hohe Anzahl von Nutzern (über 1.000 tägliche Nutzer) mit Daten und Informationen zu versorgen.

6. Fachlicher Nutzen

Ein weiterer Vorteil des Data Lakehouse bei der KVWL ist die Möglichkeit, alle fachlichen semantischen Modelle, Prozesse und Berichtsfrontends 1:1 zu übernehmen. Dies erleichtert die Integration in bestehende Systeme und minimiert den Anpassungsaufwand.

7. Schrittweise Migration

Eine Migration zu einem Data Lakehouse kann schrittweise erfolgen, was das Risiko minimiert und eine kontinuierliche Anpassung ermöglicht. 

8. Finanzieller Nutzen

Die Kosteneffizienz einer On-Premises-Lösung zeigt sich nicht nur in den geringeren laufenden Kosten im Vergleich zur Cloud, sondern auch in der Minimierung des Migrationsaufwands. Durch die schrittweise Migration und die Nutzung bestehender Infrastrukturen können die Gesamtkosten erheblich reduziert werden. Dabei ist jedoch der Wissensaufbau in der eigenen Organisation gegenzurechnen.

9. Nachteile einer Nicht-Cloud-Lösung

  • Eingeschränkte Innovationsgeschwindigkeit und Skalierung: Cloud-Lösungen bieten oft schnellere Innovationszyklen und einfachere Skalierungsmöglichkeiten. On-Premises-Lösungen können hier hinterherhinken, da sie auf die vorhandene Hardware und Infrastruktur beschränkt sind.
  • Administrativer Mehraufwand: Die Verknüpfung und Verwaltung verschiedener Services und Komponenten in einer On-Premises-Umgebung kann zu einem höheren administrativen Aufwand führen. Dies erfordert spezialisiertes Personal und zusätzliche Ressourcen für Wartung und Betrieb.

Zusammenfassend bietet die On-Premises-Data-Lakehouse-Lösung bei der KVWL eine kosteneffiziente, sichere und flexible Lösung, die den hohen Anforderungen an Datenschutz, Performance und Datenvolumina gerecht wird. Sie ermöglicht eine nahtlose Integration in bestehende Systeme und Prozesse und bietet langfristig finanzielle Vorteile. Allerdings müssen die Einschränkungen in Bezug auf Innovationsgeschwindigkeit, Skalierung und administrativen Aufwand berücksichtigt werden.

Andre Lohse ist leidenschaftlicher Data Enthusiast mit umfassender Erfahrung in Datenprozessen, Datenintegration und Datenarchitektur seit 2003. Seit 2006 ist er bei DATA MART tätig und seit 2018 in der Rolle als Geschäftsführer unterwegs. In der bisherigen Laufbahn hat er zahlreiche Unternehmen dabei unterstützt, ihre Datenstrategien zu optimieren und innovative Lösungen zu implementieren. Seine Expertise umfasst die Entwicklung und Umsetzung von Data-Architekturen und komplexer analytischer Datenlandschaften. Mit dieser Leidenschaft für Daten und Technologie verfolgt er das Ziel, Menschen zu inspirieren und mit qualitätsorientierten und datengetriebenen Entscheidungen erfolgreich zu sein.

Anne Schlebusch ist seit mehr als 30 Jahren als Entwicklerin, Team- und Projektleiterin im Geschäftsbereich "IT & Digital Health" der KVWL tätig. Seit 2012 ist sie als technische Projektleiterin des Datawarehouse dafür zuständig, die Weiterentwicklung und den Ausbau des DWH voranzutreiben.

Andre Lohse, Anne Schlebusch
09:00 - 09:45
Vortrag: Do 1.1

Vortrag Teilen