Zum Hauptinhalt springenZum Seitenfuß springen

 |  Blog

Machine-Learning-Projekte automatisieren mit AutoML

Mit den jüngsten Erfolgen in der Entwicklung von generativer KI wie ChatGPT hat der Begriff "Künstliche Intelligenz" den endgültigen Durchbruch in der breiten Öffentlichkeit geschafft und gewinnt zunehmend an Beliebtheit in der Gesellschaft. In Verbindung mit der fortschreitenden Digitalisierung und der wachsenden Datenmenge ist es keine Überraschung, dass immer mehr Unternehmen den Einsatz von KI in Betracht ziehen oder diskutieren.

Die Umsetzung eines KI-Projekts ist jedoch aufgrund der hohen Anpassungsfähigkeit und Komplexität der zu lösenden Probleme oft nicht einfach und erfordert Zeit und Fachwissen, über das nur eine begrenzte Anzahl von Experten verfügt. Daher ist es von großer Bedeutung, die vorhandene Expertise optimal zu nutzen, um schnell zu einem zufriedenstellenden Ergebnis oder einem Proof-of-Concept zu kommen.

Das Problem des begrenzten Fachwissens bei der Durchführung von KI-Projekten könnte nun durch "Automated Machine Learning" (im Folgenden AutoML) gelöst werden. AutoML ist ein aufstrebendes Feld im Bereich der künstlichen Intelligenz, das sich mit der Automatisierung des Machine-Learning-Workflows befasst. Ziel von AutoML ist es, möglichst viele Schritte in einem Machine-Learning-Projekt zu automatisieren, um die Entwicklungszeit zu verkürzen und effizienter zu gestalten. Dazu werden Automatisierungswerkzeuge und Algorithmen eingesetzt, die die manuelle Auswahl und Konfiguration von Algorithmen und Hyperparametern automatisieren.

 

Grundsätzlich umfasst ein durch AutoML unterstützter Machine-Learning-Workflow dieselben Schritte wie ein klassischer Machine-Learning-Workflow. Zusätzlich werden einzelne Schritte automatisiert. Die Automatisierung einzelner Schritte bleibt jedoch eine Herausforderung und kann nicht immer in gleichem Maße erreicht werden. Für die Optimierung sind die Schritte der Modellauswahl und der Hyperparameteroptimierung am besten geeignet, da sie unspezifisch und unabhängig vom Anwendungsfall sind und daher als Kern von AutoML angesehen werden. Darüber hinaus gibt es Bemühungen, weitere Schritte wie die Datenbereinigung, die Erstellung und Auswahl von Features sowie die Erklärbarkeit von Vorhersagen zu automatisieren. AutoML kann Data Scientists auch bei einigen dieser Schritte unterstützen, insbesondere wenn kein oder nur wenig domänenspezifisches Wissen erforderlich ist. Beispielsweise können bei der Datenerfassung und -aufbereitung mechanische Standardaufgaben wie die Vereinheitlichung von Spalteneinträgen übernommen werden.

 

AutoML-Lösungen lassen sich in drei Kategorien unterteilen:

  1. Eigenständige Code-Pakete wie AutoGluon, H20 AutoML und TPOT erfordern Programmierkenntnisse in Python.
  2. AutoML-Lösungen in Cloud-Diensten wie Azure Machine Learning, Amazon SageMaker oder Googles Vertex AI sind einfach zu bedienen und bieten sowohl no-/low-code Benutzeroberflächen als auch die Möglichkeit, eigene Notebooks mit Cloud-Ressourcen zu verarbeiten.
  3. Spezialisierte Data-Science-Plattformen wie Dataiku, H20, RapidMiner oder DataRobot bieten eine benutzerfreundliche grafische Oberfläche und können auf spezifische Use Cases zugeschnitten werden. In der Regel sind die Funktionen und der Support im Gesamtkontext der MLOps bei den Data Science Plattformen umfangreicher.

 

Aufgrund der langjährigen Erfahrung im Bereich Cloud Computing kann M&M bei der Erstellung von Proof of Concepts auf die Dienste von Azure Machine Learning und die integrierte AutomatedML-Funktionalität zurückgreifen. Durch den Einsatz dieser Tools ist M&M in der Lage, seine Ziele schnell und effizient zu erreichen und gleichzeitig Kosten zu sparen. Azure Machine Learning ist eine vollständig gemanagte Cloud Service Plattform, die das Erstellen, Trainieren und Bereitstellen von Machine Learning Modellen vereinfacht. Die integrierte AutomatedML-Funktion bietet eine automatisierte Modellierung, die die manuelle Konfiguration von Modellen und Hyperparametern ersetzt. Dadurch kann M&M die Entwicklungszeit verkürzen und die Effizienz steigern, ohne die Qualität der Ergebnisse zu beeinträchtigen.

Wenn Sie mehr über die Einsatzmöglichkeiten und Funktionen von AutoML erfahren möchten, wenden Sie sich gerne an unser Expertenteam.

Über den Autor

 

Als Teil des Data & AI Teams unterstützt Lukas Hauser Unternehmen bei der Entwicklung datengetriebener Geschäftsmodelle und der Implementierung von Machine-Learning-Modellen. In seiner Bachelorthesis hat er verschiedene AutoML-Angebote verglichen und bewertet. Ab Oktober 2023 beginnt er seinen berufsbegleitenden Master in Künstlicher Intelligenz, um seine Fähigkeiten und Kenntnisse auf diesem Gebiet weiter auszubauen. 

Erstellt von