Die im Konferenzprogramm der TDWI München 2023 angegebenen Uhrzeiten entsprechen der Central European Time (CET).
Per Klick auf "VORTRAG MERKEN" innerhalb der Vortragsbeschreibungen kannst du dir deinen eigenen Zeitplan zusammenstellen. Du kannst diesen über das Symbol in der rechten oberen Ecke jederzeit einsehen.
Hier kannst Du die Programmübersicht der TDWI München 2023 mit einem Klick als PDF herunterladen.
Die Zement- und Betonproduktion ist für knapp 10 % der globalen CO2 -Emissionen verantwortlich und stellt damit einen gewaltigen Hebel bei der Erreichung wichtiger Klimaziele dar. Die Suche nach klimafreundlicheren Alternativen erfolgt heute aber größtenteils aufwendig manuell auf Basis von Erfahrungswerten. Wir zeigen das enorme Potenzial KI-gestützter Priorisierung auf, insbesondere des sequenziellen Lernens, und stellen eine Applikation vor, die eine Feedback-Schleife zwischen Vorhersage und Validierung neuer Rezepturen realisiert.
Zielpublikum: Data Scientist, Product Owner, Fachabteilung
Voraussetzungen: Grundlagen im Bereich Machine Learning
Schwierigkeitsgrad: Einsteiger
Extended Abstract:
Die Bauindustrie und insbesondere die Beton- und Zementherstellung tragen massiv zum weltweiten CO2-Ausstoß bei. Daher ist es zwingend notwendig, möglichst schnell alternative Baustoffe zu entwickeln. Gleichzeitig ist Beton als Baustoff in weiten Bereichen als alternativlos zu betrachten. CO2-optimierte Betonrezepturen stehen daher im Fokus der Forschung. Neben verbesserter Umweltfreundlichkeit müssen diese allerdings Mindestanforderungen an mechanischen Eigenschaften wie Druckfestigkeit erfüllen. Schließlich müssen Faktoren wie Kosten und Verfügbarkeit berücksichtigt werden.
Die Suche nach neuen Varianten ist dabei sehr aufwendig: Typische Rezepturen werden durch 40 oder mehr Parameter charakterisiert. Neben chemischer Komposition sind hier auch Informationen zum Herstellungsprozess, sowie Mischverhältnisse mit Gesteinen, Wasser usw. relevant. Während sich die CO2-Bilanz des Herstellungsprozesses auf Basis dieser Parameter heuristisch abschätzen lässt, ist es a priori nicht möglich, Eigenschaften wie Druckfestigkeit des resultierenden Materials auf Basis von Modellen vorherzusagen. Zeitaufwendige und kostenintensive Experimente sind notwendig, um diese zu ermitteln.
Statt basierend auf Erfahrungswerten mögliche Kandidaten zu verproben, stellt sich die Frage, ob hier ein KI-basierter Ansatz helfen kann. Allerdings gibt es aufgrund des aufwendigen Herstellungsprozesses wenige gelabelte Daten. Die Kombination aus komplexem Parameterraum bei gleichzeitig wenigen bekannten Labels führt dazu, dass Standard-Regressionsalgorithmen nicht oder nur sehr eingeschränkt helfen.
Typischerweise können Machine Learning-Algorithmen verlässliche Vorhersagen machen, wenn ein repräsentatives Sample von Features und zugehörigen Labels für das Training verfügbar ist. Es stellt sich daher die Frage, ob und wie ein solches Sample möglichst effizient generiert werden kann, insbesondere bei hoher Dimensionalität der Daten und wenn Labels teuer sind. Je nach Problemstellung kann es dabei helfen, sich auf spezifische Bereiche der Verteilung zu fokussieren. Möchte man zum Beispiel nur Werte oberhalb einer definierten Grenze vorhersagen, reicht es aus, den Teil der Verteilung zu lernen, der zu eben solchen Werten führt.
Ein vielversprechender Ansatz ist Sequential Learning, eine Form der Bayes'schen Optimierung. Über sukzessives und gezieltes Anreichern der Trainingsdaten um weitere Labels ist es möglich, effizient die Vorhersagen der Algorithmen in noch nicht explorierten Parameterbereichen zu verbessern. Statt zufällig Daten auszuwählen und möglicherweise aufwendig zu labeln, wird versucht mithilfe passender Metriken gezielt Datenpunkte zu priorisieren. Im Kontext der Materialwissenschaften wird somit ein Feedback Loop zwischen KI-Vorhersage und tatsächlichem Experiment realisiert. Schritt für Schritt wird der Algorithmus mit neuem Wissen aus dem Labor angereichert und somit werden Vorhersagen iterativ verbessert.
Mit Kollegen der Bundesanstalt für Materialforschung und -prüfung (BAM) haben wir im Detail die Implikationen dieses Ansatzes für die Betonforschung analysiert. Pro Iteration werden die Rezepturen gemäß dem Kriterium 'Nützlichkeit' priorisiert. Dieses umfasst sowohl Vorhersagen für Parameter wie Druckfestigkeit, als auch a priori Information zu sozioökonomischen Faktoren wie CO2-Ausstoß. Unsere Ergebnisse implizieren, dass sich mit Sequential Learning sehr viel schneller Rezepturen mit den gewünschten Eigenschaften identifizieren lassen, als es beim zufälligen Samplen der Fall ist. Diese Ergebnisse und die Universalität des Ansatzes legen nahe, dass Sequential Learning auch in anderen Forschungs- und Industriebereichen erfolgreich angewandt werden kann.
Schließlich gebe ich einen kurzen Einblick in SLAMD, eine Webapp, die wir mit der BAM entwickelt haben. Diese stellt intuitive Funktionen für eine konkrete experimentelle Kampagne zur Verfügung und ermöglicht es so, die beschriebenen Ideen schneller umzusetzen. Aufgrund der einfachen Bedienbarkeit ist es somit möglich, moderne Materialforschung und Sequential Learning auch jenseits der Forschungsinstitute einem breiteren Publikum zugänglich zu machen.
Dr. Tehseen Rug hat nach seiner Promotion mit anschließendem Post Doc in der theoretischen Physik die Software-Welt für sich entdeckt. Als Senior AI & Data Engineer bei iteratec unterstützt er Kunden bei diversen Softwareprojekten in den Bereichen Data Analytics, AI und Software- und Cloud-Architektur. Privat interessiert er sich für alle Themen rund um Technologie und Forschung.