KI Apps

H2O AutoML

Website
Screenshot der Startseite von H2O AutoML
Zusammenfassung mit KI ⊛

In den letzten Jahren hat die Nachfrage nach Machine-Learning-Experten die Verfügbarkeit überstiegen, trotz des Anstiegs von Menschen, die in diesem Feld tätig sind. Um diese Lücke zu schließen, wurden große Fortschritte bei der Entwicklung von benutzerfreundlichen Machine-Learning-Software erzielt, die von Nicht-Experten verwendet werden kann. Die ersten Schritte zur Vereinfachung von Machine Learning umfassten die Entwicklung einfacher, einheitlicher Schnittstellen für eine Vielzahl von Machine-Learning-Algorithmen (z.B. H2O).

Obwohl H2O es Nicht-Experten ermöglicht hat, mit Machine Learning zu experimentieren, ist noch immer ein beträchtliches Wissen und Hintergrundwissen in Data Science erforderlich, um hochleistungsfähige Machine-Learning-Modelle zu erstellen. Tiefere neuronale Netze sind insbesondere für Nicht-Experten schwierig zu justieren. Um Machine-Learning-Software wirklich für Nicht-Experten zugänglich zu machen, haben wir eine einfache Schnittstelle entwickelt, die den Prozess des Trainings einer großen Auswahl an Kandidatenmodellen automatisiert. H2O's AutoML kann auch ein hilfreiches Werkzeug für erfahrene Benutzer sein, indem es eine einfache Wrapper-Funktion bereitstellt, die viele modellbezogene Aufgaben ausführt, die normalerweise viele Codezeilen erfordern, und indem es ihre Zeit für andere Aspekte der Datenwissenschaft-Pipeline-Aufgaben wie Daten-Vorverarbeitung, Feature-Engineering und Modell-Deployment frei gibt.

Funktionen von AutoML

  • Automatisierte Daten-Vorverarbeitung: Imputation, One-Hot-Encoding, Standardisierung
  • Trainiert zufällige Grids einer Vielzahl von H2O-Modellen mit effizienten und sorgfältig konstruierten Hyper-Parameter-Räumen
  • Justiert einzelne Modelle mit Kreuzvalidierung
  • Stacked Ensembles werden trainiert, um die Modellleistung zu maximieren
  • Alle Modelle sind verfügbar und werden nach verschiedenen Metriken in der Leaderboard aufgeführt
  • Modelle können automatisch erklärt werden, indem die H2O Explainability-Modul verwendet wird
  • Modelle können leicht in die Produktion exportiert werden

AutoML-Schnittstelle

Die H2O-AutoML-Schnittstelle ist so konzipiert, dass sie so wenige Parameter wie möglich hat, damit der Benutzer nur auf seine Daten zeigen, die Antwortspalte identifizieren und optional eine Zeitbeschränkung oder eine Begrenzung auf die Anzahl der insgesamt trainierten Modelle angeben muss. Die Parameter, die vom Benutzer in den R- und Python-Schnittstellen angegeben werden können, sind:

  • y: Der Name (oder Index) der Antwortspalte
  • training_frame: Die Trainingsmenge
  • max_runtime_secs: Die maximale Laufzeit in Sekunden
  • max_models: Die maximale Anzahl der trainierten Modelle

Vorteile von AutoML

  • Reduziert die Notwendigkeit von Expertenwissen in Machine Learning
  • Verbessert die Leistung von Machine-Learning-Modellen
  • Erhöht die Reproduzierbarkeit und etabliert eine Basis für wissenschaftliche Forschung oder Anwendungen
  • Skaliert die Trainingsdatenmenge auf Cluster (Hadoop, Spark, Kubernetes)

Wie Sie mit H2O AutoML beginnen können

Um mit H2O AutoML zu beginnen, können Sie die offene Quellversion von H2O herunterladen und die AutoML-Funktionen in R, Python oder über die Web-GUI verwenden. Weitere Informationen und Ressourcen finden Sie auf der H2O-Website.

Ähnliche KI-Apps

* KI-Zusammenfassungen können Fehler enthalten. Alle Angaben ohne Gewähr.