„Overfitting“ bedeutet, dass ein Modell zu komplex ist und infolgedessen unzuverlässig für die Vorhersage neuer Daten ist. Overfitting tritt tendenziell auf, wenn es zu viele Treiber im Verhältnis zur Anzahl der verfügbaren Datenpunkte gibt. Zum Beispiel: Sie haben möglicherweise nur 50 Datenzeilen und 100 Treiber (Spalten) im Datensatz.
Das prädiktive Modell kann alle Treiber verwenden, um eine Reihe komplizierter Regeln zu entwickeln, die gut gegen die Daten abschneiden, die zur Schulung des Modells verwendet wurden, obwohl in Wirklichkeit die vorhergesagte Metrik möglicherweise nur von ein oder zwei Prädiktoren beeinflusst wird.
Als Faustregel gilt: Einfacher ist besser. Je mehr Treiber in ein Modell eingeführt werden, desto mehr Fehler existieren, die potenziell die wahre zugrunde liegende Beziehung verdecken können, die Sie aufdecken möchten.
Benutzer müssen angemeldet sein, um Kommentare zu schreiben
Anmelden
Antworten
Bereits Qlik AutoML verwenden?
Über Qlik AutoML
Qlik AutoML (automatisiertes maschinelles Lernen) bringt KI-generierte maschinelle Lernmodelle und prädiktive Analysen direkt zur größeren Gemeinschaft von Analysebenutzern und -teams Ihrer Organisati
Mit über 2,5 Millionen Bewertungen können wir Ihnen die spezifischen Details liefern, die Ihnen bei der informierten Softwarekaufentscheidung für Ihr Unternehmen helfen. Das Finden des richtigen Produkts ist wichtig, lassen Sie uns helfen.