Wenn Maschinen das Lernen lernen
Computer programmieren sich selbst: Machine Learning ist eine revolutionäre digitale Innovation mit fast endlos vielen Anwendungsmöglichkeiten im Business. Doch in der Praxis bleiben viele Projekte stecken, gibt Big Data Engineer Volkan zu bedenken, der bei der ING in Deutschland für Big Data, Machine Learning und DevOps zuständig ist. Die Lösung: ein As-a-Service-Angebot, mit dem Nutzer Maschinenlernen als komfortables Komplettpaket beziehen können. IT-Experte Volkan erklärt Hintergrund und Umsetzung.
Es klingt wie Science-Fiction: Rechner werden mit Beispielen darauf trainiert, die Lösung bestimmter Aufgaben eigenständig zu erlernen. Mit ihren autonom erzeugten Algorithmen arbeiten die Computermodelle dann präziser, schneller und umfassender, als ihre menschlichen „Lehrer“ es je könnten. An Use Cases für diese Zukunftstechnologie herrscht schon heute wahrlich kein Mangel. Das enorme Effizienzpotenzial ist natürlich auch für die Online-Bank ING attraktiv. Damit es von den Fachbereichen besser gehoben werden kann, entwickelt Volkan mit seinem Team eine Rundum-Lösung für die reibungslose Implementierung „as a service“: „Machine Learning as a Service (MLaaS) ist nicht nur ein Tool für das Bauen von Modellen, sondern beinhaltet auch alles drum herum, was nötig ist, um ein Modell live zu stellen: von der Vorbereitung bis hin zum Produktions-Deployment.“
Der Rechner macht sich nützlich: Die Use Cases
Machine Learning Use Cases – in der ING sind sie so vielfältig wie die Bereiche selbst: etwa Datenextraktion, Betrugserkennung, Monitoring in der IT oder Dokumentenklassifizierung. Letzteres ist beispielsweise eine Aufgabe, bei der bislang ein ziemlich hoher – und nicht gerade produktiver – manueller Aufwand betrieben wird. Dokumente, die über verschiedene Kanäle eingehen, müssen sortiert werden – z.B. in Verträge oder Dokumente zu Baufinanzierungen. Traditionelle Tools versagen aber bei diesem Beispiel in 40 Prozent der Fälle bei der Zuordnung der erforderlichen Kriterien wie Typ, Ursprung und Zielort. Dies macht eine manuelle Sortierung der übrigen Dokumente nötig. Durch den Einsatz eines trainierten Modells kann der manuelle Anteil auf 20 Prozent gesenkt werden – eine erhebliche Einsparung, die viel Arbeitskraft für nützlichere Einsatzzwecke freimacht. Dennoch: In vielen Feldern bleibt immer noch eine menschliche Aufsicht über das Werkeln der Algorithmen nötig, etwa in der Betrugserkennung. Verdächtige Fälle werden zunächst nur geflaggt und einem „humanoiden“ Bearbeiter für die endgültige Einordnung zugeführt. Erfahrungswerte aus der Alltagspraxis können dann aber auch wieder ins System eingespeist werden, um die Modelle durch neue Trainings noch weiter zu verbessern.
Von der Theorie in die Praxis
Das MLaaS-Angebot sorgt nun dafür, dass all die schönen Use Cases wie der beschriebene nicht nur theoretisch gut klingen, sondern auch wirklich umgesetzt werden. Denn im Alltag sieht es oft so aus, dass ein Data Scientist zwar ein interessantes neues Modell erarbeitet – aber wie dieses dann aktiviert werden kann, ist ein ganz anderes Thema, wie Volkan ausführt: „Hierbei stellt sich dann immer wieder die Frage, wer das Modell übernimmt, wie dieses Modell in die Produktion kommt und wer für den ganzen Governance-Aufwand zuständig ist. Und dies wiederholt sich dann bei jedem Projekt.“ Allzu oft bleiben Projekte wegen solcher Probleme sogar ganz auf der Strecke. Mit MLaaS kann Volkan dagegen eine zentrale Anlaufstelle für seine „Kunden“ anbieten, also für die Data Scientists aus dem ganzen Unternehmen, die für die Fachbereiche Lösungen erarbeiten wollen. Mit Betrieb, Wartung und Aktualisierung müssen sie sich in Zukunft nicht mehr beschäftigen. Denn MLaaS bietet von Haus aus abgesicherte und getestete Umgebungen. Die „Produktivierung“ der Projekte verläuft viel glatter und schneller, der Aufwand sinkt signifikant. Die Data Scientists sind durch diesen Ansatz unabhängiger von anderen Teams und Einheiten, das Bauen der Modelle wird erleichtert, das Deployment vereinfacht. Und nicht zuletzt bieten die Kollegen*innen einen umfassenden End-to-End-Support rund um den ganzen Lebenszyklus des Produkts. DevOps in Reinkultur – mit allen Vorteilen.
Ein buntes Mosaik: Tools & Module
Wie kann der zügige Projektablauf bei MLaaS gewährleistet werden? Durch die Bereitstellung einer breiten Palette an Tools und erprobten Workflows, aus denen sich Kunden wie aus einem Katalog bedienen können – frei nach dem Motto: auswählen, bestellen, benutzen. Volkan: „Wir unterstützen das Projekt vom Start bis zur Produktion, liefern eine Umgebung mit spezifisch für das Projekt zugeschnittenem Tooling und bieten gleich auch standardisierte Pipelines.“ Diese stellen sicher, dass Modelle ohne großen Aufwand live geschaltet werden können. Grundlage für die MLaaS-Lösung ist jupyter als Coding-Umgebung, in der die Data Scientists ihre Modelle gestalten. Dazu treten optional hinzubuchbare Module wie die Berechnungscluster Spark oder Dask, falls die Ressourcen von jupyter für ein bestimmtes Projekt nicht ausreichen. Ergänzend kommt im MLaaS-Workflow MLFlow zum Einsatz, ein Model Repository, in dem fertige Modelle für die zukünftige Weiterverwendung abgelegt werden. Die Komponenten können dabei jederzeit ausgetauscht oder erweitert werden. Möglich ist diese Modularität, weil die ganze Projektumgebung in einer Private Cloud läuft (OpenShift). Da für die ING als Bank branchenbedingte regulatorische Einschränkungen beim Umgang mit Daten gelten, mussten auch manche Applikationen selbst entwickelt werden. Beispielsweise ein S3-Proxy, der „on premise“ installiert ist – also ein Datensystem für das bequeme und sichere Laden und Speichern.
Eine Frage der Organisation: IT-Engineering für die ING
Schnell, günstig, modular und zukunftssicher: Der MLaaS-Ansatz überzeugt auf der ganzen Linie. Aber natürlich gibt es bei der Umsetzung auch Hürden. „Einfach ist es nicht“, fasst Volkan zusammen. Eine besondere Herausforderung ist z.B. das Thema Zusammenarbeit. Ein Projekt, bei dem verschiedene Module und Bereiche integriert werden, erfordert besondere Anstrengungen in der Koordination, zumal in einem Weltkonzern wie der ING mit ihren vielen internationalen Töchtern. Dabei hilft aber die konsequent agile Arbeitsweise bei dieser dynamischen Bank. Engineering-Profis wie Volkan arbeiten mit Data Scientists und Fachbereichs-Experten projektweise in Squads zusammen. Die Agilität der Organisation ist einer der vielen Pluspunkte, die sämtliche IT-Jobs bei der ING bieten – neben der globalen IT-Community, viel Raum zur Weiterentwicklung und einem großzügigen Bildungsbudget. Sowie spannenden fachlichen Herausforderungen. Im Fall von MLaaS: der weitere Ausbau des Dienstes in punkto Lifecycle Management, automatisiertes Deployment und Repository. An den Standorten Frankfurt a.M. und Nürnberg werden ständig neue Kräfte gesucht. Wer die nötige Neugier auf innovative IT-Themen mitbringt, findet alles Weitere über IT-Chancen bei der ING auf unserer job-Seite.