Alles beginnt mit den Daten – Müll rein, Müll raus. Einige Faktoren, die die Modellqualität beeinflussen können:
- Wenn es Daten gibt, die unrein oder unzuverlässig sind, sollten sie aus dem Satz entfernt werden. Unrein oder unzuverlässig könnte bedeuten, dass die Mehrheit der Spaltenwerte null ist, eine hohe Konzentration eines Wertes in einer einzelnen Spalte (z. B. eine Spalte mit den Werten 'rot', 'grün', 'blau' und 90 % der Werte in der Spalte sind 'rot'), Werte in einer Spalte sind hochgradig einzigartig.
- Wenn die Art der gesammelten Daten eine signifikante Veränderung erfahren hat (zum Beispiel könnte eine wichtige politische Änderung, die in Kraft tritt, bedeuten, dass die vorherigen Daten den neuen Daten nicht ähneln).
- Ein größeres Datenvolumen neigt dazu, zuverlässigere Modelle zu produzieren, daher werden alle zusätzlichen relevanten Datenpunkte helfen, sei es neue Beobachtungen, die im Laufe der Zeit gesammelt werden, oder historische, die aus einer zuvor ungenutzten Quelle stammen.
Wenn Ihr Modell immer noch nicht gut abschneidet, könnte es auch daran liegen, dass die Metriken, die tatsächlich eine Beziehung zur vorhergesagten Metrik haben, noch nicht im Datensatz erfasst sind. Es könnte an der Zeit sein, zu überlegen, welche anderen Dinge einen Einfluss auf die vorhergesagte Metrik haben könnten, und zu prüfen, ob diese Daten gesammelt und in den Datensatz aufgenommen werden können. Denken Sie daran – die prädiktiven Algorithmen können nur Muster identifizieren, die vorhanden sind!
Benutzer müssen angemeldet sein, um Kommentare zu schreiben
Anmelden
Antworten
Bereits Qlik AutoML verwenden?
Über Qlik AutoML
Qlik AutoML (automatisiertes maschinelles Lernen) bringt KI-generierte maschinelle Lernmodelle und prädiktive Analysen direkt zur größeren Gemeinschaft von Analysebenutzern und -teams Ihrer Organisati
Mit über 2,5 Millionen Bewertungen können wir Ihnen die spezifischen Details liefern, die Ihnen bei der informierten Softwarekaufentscheidung für Ihr Unternehmen helfen. Das Finden des richtigen Produkts ist wichtig, lassen Sie uns helfen.