Contenu du cours
Reconnaissance des Chiffres Manuscrits
Équilibre des Classes
Assurer l'équilibre des classes dans les ensembles de données d'apprentissage automatique est essentiel pour éviter un biais du modèle envers une classe spécifique. Lorsqu'un ensemble de données est équilibré, cela signifie une représentation équitable de toutes les classes, ce qui est fondamental. Un ensemble de données déséquilibré peut entraîner une performance sous-optimale du modèle, en particulier pour la prédiction de la classe minoritaire.
Prenons l'exemple d'un ensemble de données constitué de transactions de clients où 90 % sont légitimes et seulement 10 % frauduleuses. En entraînant un modèle sur des données aussi biaisées, celui-ci pourrait être amené à prédire la majorité des transactions comme légitimes. Ce biais s'explique par le fait que le modèle est optimisé pour réduire l'erreur globale, or identifier la plupart des transactions comme légitimes augmente la précision, même si cela reste superficiel.
Ainsi, maintenir l'équilibre des classes est impératif pour entraîner des modèles sur un échantillon diversifié de chaque classe, renforçant ainsi leur capacité à effectuer des prédictions précises dans l'ensemble.
Swipe to start coding
-
Extraire les étiquettes cibles (valeurs numériques) de l'ensemble de données MNIST et les assigner à la variable
Y
. -
Visualiser la distribution des fréquences des étiquettes numériques de l'ensemble de données MNIST en créant un graphique de comptage.
Solution
Merci pour vos commentaires !