Perspektive

Ein Leitfaden für Machine Learning Operations (MLOps)

Vani Dhandapani & Venkata Srinageswara Prabhakar Rallabhandi
Veröffentlicht: September 29, 2021

Weniger als die Hälfte der ML-Modelle geht in Produktion! Warum?

Mit der kontinuierlichen Weiterentwicklung der Technologien für maschinelles Lernen gewinnt die Verbreitung von ML-basierten Lösungen und die Produktionseinführung in großem Maßstab rasch an Fahrt. Eine Gartner-Studie zeigt jedoch, dass nur 47 % der KI-/ML-Modelle in Unternehmen in Produktion gehen. Ein Teil des Grundes liegt darin, dass die grundlegenden Realitäten des maschinellen Lernens unterschätzt werden. Dazu gehören unter anderem:

  1. Der manuelle und experimentelle Charakter von ML (man muss verschiedene Parameter, Merkmale, Algorithmen, Hyperparameter usw. manuell ausprobieren)
  2. Manuelle Verfolgung von Datenabhängigkeiten
  3. Die Komplexität der Versionierung und Verfolgung von Modellexperimenten, Training und Einsatz
  4. Versteckte Anhäufung technischer Schulden bei ML 

Ein weiterer Grund ist das Fehlen eines rationalisierten Verfahrens zur Durchführung von ML-Projekten. ML-Initiativen sind eine koordinierte Anstrengung mehrerer Funktionen, und Code ist nur eine davon.

Betrieb des maschinellen Lernens (MLOPs)
Betrieb des maschinellen Lernens (MLOPs)

Untersuchungen zeigen, dass die meisten Data-Science-Teams die meiste Zeit mit der Datenverarbeitung, der Datenaufbereitung, der Verwaltung von Softwarepaketen & Frameworks, der Konfiguration der Infrastruktur und der Integration von Komponenten verbringen – die meisten dieser Aufgaben lassen sich als unterstützende Aufgaben verallgemeinern. Selbst die ML-Entwicklung an sich wurde bisher hauptsächlich manuell durchgeführt, angetrieben von der Data Science- und Data Engineering-Community.

Insgesamt bestimmen diese Faktoren das Tempo, mit dem ML-Projekte von der Pilot- zur Produktionsphase übergehen. Um die Wiederholbarkeit und Zuverlässigkeit von ML-basierten Lösungen zu gewährleisten, benötigen Unternehmen ein ausgereiftes MLOps-Ökosystem. Dazu gehören die richtigen Tools, Prozesse und entsprechend qualifizierte Talente.

 

Entschlüsselung von MLOps: Ein Wendepunkt!

Laut der Boston Consulting Group (BCG), einem Pionier auf dem Gebiet der KI im großen Maßstab, haben Unternehmen, die KI im gesamten Unternehmen einsetzen, mit ihren Investitionen einen bedeutenden Wert erzielt. Diese Unternehmen investieren in der Regel 10 % ihrer KI-Investitionen in Algorithmen, 20 % in Technologien und bis zu 70 % in die Einbettung von KI in Geschäftsprozesse und neue Arbeitsweisen. Mit anderen Worten: Diese Unternehmen investieren doppelt so viel in Menschen und Prozesse wie in Technologien.

Unternehmen, die über das Experimentieren hinausgehen und ML in ihre Geschäftsprozesse einbinden wollen, werden MLOps als einen Wendepunkt erleben. MLOps ist eine aufkommende Softwareentwicklungsdisziplin, die dazu beiträgt, den Entwicklungszyklus zu verkürzen und die Bereitstellungsgeschwindigkeit von ML-basierten Lösungen in großem Umfang zu beschleunigen. Sie arbeitet an der Schnittstelle von DevOps, Data Engineering und maschinellem Lernen, wie in der folgenden Abbildung beschrieben. 

Betrieb des maschinellen Lernens (MLOPs)
Betrieb des maschinellen Lernens (MLOPs)
  • DevOps hat die Software-Engineering-Teams bei ihren Problemen mit fragmentierten Toolchains, der Gesamtperspektive, Silos zwischen Entwicklungs- und Betriebsteams und langen Release-Zykluszeiten unterstützt. In ähnlicher Weise befasst sich MLOps mit den Herausforderungen des ML-Lebenszyklus in den Bereichen Feature Store, Modellerstellung, Modellschulung und -bewertung, Modellversionierung, Modellstufenübergang, Modellwartung, Überwachung und Governance. Und dies wird erreicht durch: Continuous Integration (CI), Continuous Delivery (CD) und Continuous Training & Monitoring. 

  • Während CI/CD die Herausforderungen der Datenerfassung und Modellerstellung angeht, ist Continuous Training auf die experimentelle Natur des ML-Lebenszyklus ausgerichtet. Wie bereits erwähnt, sind ML-Anwendungen sehr experimentell. Viele Aspekte, wie z. B. Algorithmen, Hyperparameter usw., müssen laufend optimiert werden, um eine angemessene Genauigkeit zu erreichen. Nach der Bereitstellung sind ML-Lösungen dafür bekannt, dass sie „driften“ (Leistungsabfall). Dieser Drift ist auf mehrere Faktoren zurückzuführen: Änderung der Datenprofile, Unterschied zwischen der trainierten Pipeline und der bereitgestellten Pipeline usw. Aus diesem Grund müssen die eingesetzten Modelle ständig überwacht und gesteuert werden. Diese Aufgabe übernimmt Continuous Monitoring.

Einführung von MLOps: Die Reise vom Fundament zur Exzellenz

CDOs und CIOs, die in MLOps investieren wollen, müssen sich auf Menschen, Prozesse und Tools/Beschleuniger konzentrieren. Der erste Schritt kann die Bewertung des MLOps-Reifegrads sein. 

Betrieb des maschinellen Lernens (MLOPs)
Betrieb des maschinellen Lernens (MLOPs)

Menschen:

  • Wie bei DevOps, das die Zusammenarbeit von Entwicklungs- und Ops-Teams erfordert, müssen bei MLOps mehrere Kompetenzen wie Dateningenieure, ML-Ingenieure und Entwicklungsteams für Geschäftslogik zusammenarbeiten. Jeder muss verschiedene Aspekte der ML-Anwendung sehen. 

Vorgänge:

  • Der Prozess muss auf der Grundlage der MLOps-Reifebewertung maßgeschneidert werden.
  • Der MLOps-Prozess muss die Integration mit bestehenden DevOps-Prozessen gewährleisten und gleichzeitig die zusätzlichen einzigartigen Funktionen bereitstellen, die für die Verwaltung von ML erforderlich sind.

Tools/Beschleuniger:

Die MLOps-Toolchain muss Sichtbarkeit, verwaltete Zugriffskontrolle und Funktionen für die Zusammenarbeit der beteiligten Teams bieten. Derzeit gibt es drei Hauptkategorien von MLOps-Plattformen.

  • Große Cloud-Plattformen wie AWS, Microsoft und Google verfügen über integrierte MLOps-Funktionen in ihren Machine Learning-Services.

  • Open-Source-basierte MLOps-Frameworks wie KubeFlow oder MLFlow verwalten viele Aspekte des Lebenszyklus von Machine-Learning-Lösungen.

  • Angebote von auf KI spezialisierten Anbietern wie DataBricks, DataRobot, Verta usw. konzentrieren sich auf den gesamten Lebenszyklus oder einzelne Funktionen von Pipelines für Machine Learning wie Schulung, Überwachung und Governance.

  • Interne Beschleuniger auf der Grundlage von Open-Source-Tools rationalisieren den gesamten ML-Lebenszyklus und bieten in einigen Fällen erweiterte Funktionen wie Überwachung und Steuerung.

Der MLOps-Markt steht kurz vor einer angemessenen Konsolidierung. 

Optimale Praktiken für häufige Probleme

Herausforderungen Best Practices
Verfügbarkeit qualifizierter Ressourcen und Zusammenarbeit  MLOps erfordert unterschiedliche, aber verwandte Fähigkeiten (Dateningenieure, Datenwissenschaftler und DevOps-Ingenieure). Cross Skilling und Teaming-Fähigkeiten müssen von Anfang an genau geplant werden.
Datenqualität und Risiken der ML-Produktion Data Deviation Detection, Canary Pipelines usw. sollten Teil der ML-Anwendungen sein.
Skalierbare Infrastruktur  Die ML-Anwendung muss dimensioniert und auf spezifische Hardware (z. B. GPUs) und analytische Engines abgebildet werden, die für die Pipelines erforderlich sind.
Governance und Compliance  Ein umfassender Governance-Mechanismus für die Produktion ist von entscheidender Bedeutung, um sicherzustellen, dass ML-Anwendungen im Hinblick auf Reproduzierbarkeit, Audits und Erklärbarkeit nachverfolgt werden.
ROI KPIs für Geschäftsanwendungen sollten definiert, nachverfolgt und mit der Leistung der ML-Anwendung korreliert werden.

Wettbewerbsfähiger Einblick in die Markttrends

Unsere interne (sekundäre) Forschung zur Untersuchung der organisatorischen Realität und ihrer Anwendung von MLOps ergab die folgenden Erkenntnisse:

Machine Learning Operations (MLOps) – Markttrends
Machine Learning Operations (MLOps) – Markttrends

Der US-Bankensektor gehört zu den Vorreitern (9 der 10 größten US-Banken) und verfügt über spezielle Funktionen für die Einführung und Durchführung von MLOps. Mit 7 der 10 führenden Unternehmen, die sich mit MLOps befassen, steht die US-Automobilindustrie an zweiter Stelle. Pharma, P&C Insurance Players und Kostenträger im Gesundheitswesen hinken in diesem Bereich hinterher – obwohl ML eine Technologie zu sein scheint, in die sie aktiv investieren, um geschäftliche Innovationen zu ermöglichen. MLOps ist relevant und notwendig für Unternehmen, die mit KI/ML einen Sprung machen wollen. Außerdem zeigen Branchendaten, dass der Markt für MLOps-Lösungen laut Forbes bis 2025 voraussichtlich 4 Milliarden US-Dollar erreichen wird.

Integrieren/operationalisieren Sie Ihre ML-Modelle mit der MLOps-Plattform von Virtusa

Virtusa bietet eine MLOps-Plattform an, mit der die ML-Entwicklung und -Einführung in großem Maßstab beschleunigt werden kann. Die Plattform dient als zentraler Ort für die Modellentwicklung, das Lebenszyklusmanagement und die Überwachung. Die Bereitstellung von Modellen in höheren Umgebungen, einschließlich der Produktion, wird vereinfacht. Die Plattform bietet hervorragende Überwachungs- und Governance-Funktionen, die eine ständige Bewertung und kontinuierliche Lernfunktionen ermöglichen, um überraschende Änderungen der Modellleistung in der Zukunft zu vermeiden.

Virtusa Plattform für Machine Learning Operations (MLOps)
Virtusa Plattform für Machine Learning Operations (MLOps)

Fazit:

Für den Aufbau eines vollständigen MLOps-Modells ist die Evaluierung der besten Tools, Frameworks und Methoden ein entscheidender Bestandteil jeder Organisation. Das Verständnis der Anforderungen für die erfolgreiche Implementierung von MLOps, wie oben erläutert, wird dazu beitragen, optimale Ergebnisse zu erzielen. Während die MLOps-Plattform dazu beiträgt, die ML-Reifekurve des Unternehmens zu verbessern, steigert die beschleunigte Einführung von MLOps den Erfolg der Implementierung von KI-/ML-Programmen um 50 bis 60 %. Die nachgelagerten Auswirkungen in Bezug auf die Monetarisierungsmöglichkeiten sind enorm. Die MLOps-Plattform von Virtusa hilft Unternehmen, effiziente Arbeitsabläufe zu schaffen und die Kundenerfahrung zu verbessern, indem Datenanalysen zur Beschleunigung der Entscheidungsfindung genutzt werden.

Erfahren Sie mehr über die Lösungen von Virtusa auf ML

 

Referenzen

  • Wer braucht MLOps: „What Data Scientists seek to Accomplish and How can MLOps help?“ [Was wollen Datenwissenschaftler erreichen und wie können MLOps helfen?] – Paper veröffentlicht von Sasu Mäkinen, Henrik Skogström, Eero Laaksonen, Tommi Mikkonen auf dem Portal der Cornell University: Link
  • „Continuous Delivery for Machine Learning – Automating the End-to-End Life Cycle of Machine Learning Applications“ [Kontinuierliche Bereitstellung für Machine Learning – Automatisierung des gesamten Lebenszyklus von Machine Learning-Anwendungen], von Danilo Sato, Arif Wider und Christoph Windheuser, veröffentlicht im September 2019, unter dem Link https://martinfowler.com/articles/cd4ml.html.
  • https://www.forbes.com/sites/tomtaulli/2020/08/01/mlops-what-you-need-to-know/
Verwandte Inhalte