User Tools

Site Tools


it:besonderheiten_bei_unausgewogenen_trainingsdaten

Besonderheiten bei unausgewogenen Trainingsdaten

Fragestellungen

  • Wie sind die Auswirkungen von unsausgewogenen Trainingsdaten und Validierungsdaten auf das trainierte Modell bzw. die Metrik?
  • Wie muss man das Lernen gestalten um gute Ergebnisse zu bekommen (bei Keras)?
  • Wie messen wir am besten die Güte von Modellen?
  • Wie äußert sich die Anpassung von class_weight bei Keras auf die Lernergebnisse?
  • Sind die Werte von class_weight egal und es spielt nur das Verhältnis eine Rolle?
  • Ist ROC-AUC proportional zu der besten jeweiligen F1 Score?
  • Sind die Validation-Accuracy Werte beim Trainieren proportional zu ROC-AUC und F1 Score? Das ist eine relevante Frage für die Frage wann man das Trainieren stoppen sollte.
  • Welche Auswirkungen hat es wenn die Validierungsdaten unausgewogen bzw. ausgewogen sind?
  • Gibt es unterschiede ob ich nur eine Epoche Trainiere und daran vergleiche, mehrere Epochen traniere, so lange trainiere bis ich das “beste” modell bekomme oder große und kleinere Netze habe?
  • Gibt es Unterschiede bei plain, CNN oder RNN Netzen?

Was habe ich bisher? - Bestandsaufnahme

  • Tool funktionen
    • An ein Dictionary items hängen.
  • Metrik best_f1_score für beste f1 score mit zugehörigem threshold
  • Keras Callback für Validation und Metriken

Links / Blogs / Literatur

Paper

Keras metrics

Tools

Bisherige Exdperimente

Discussion

Enter your comment. Wiki syntax is allowed:
X A K C U
 
it/besonderheiten_bei_unausgewogenen_trainingsdaten.txt · Last modified: 2019/01/06 08:56 by pmay