Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Résumé de la Régression Logistique | Régression Logistique
Classification Avec Python
course content

Contenu du cours

Classification Avec Python

Classification Avec Python

1. Classificateur K-NN
2. Régression Logistique
3. Arbre de Décision
4. Forêt Aléatoire
5. Comparer les Modèles

book
Résumé de la Régression Logistique

Examinons de plus près les avantages et les inconvénients de la régression logistique.

  1. La régression logistique utilise un processus itératif appelé descente de gradient pour trouver les paramètres.
    Étant donné que l'entraînement est un processus itératif, à n'importe quelle itération, vous pouvez ajouter sans problème de nouvelles données d'entraînement. Même une fois qu'il est entraîné, vous pouvez fournir des données d'entraînement supplémentaires et effectuer quelques itérations de plus pour améliorer le modèle ;
  2. La régression logistique est rapide.
    Comparé à d'autres algorithmes, le temps d'entraînement est assez court.
    Les prédictions sont également très rapides, contrairement au classificateur k-NN.
    De plus, la complexité computationnelle est linéaire par rapport à la taille du jeu de données. Cela signifie que la régression logistique est rapide à entraîner avec des jeux de données contenant beaucoup d'instances ;
  3. La régression logistique s'adapte mal au nombre de caractéristiques.
    Le modèle souffre d'une malédiction de la dimensionnalité. Pour qu'il fonctionne bien avec un nombre respectable de caractéristiques, vous avez besoin de beaucoup d'instances.
    De plus, la classe PolynomialFeatures crée de nombreuses caractéristiques, ce qui aggrave encore les choses ;
  4. La régression logistique prédit des probabilités. L'une des étapes que la régression logistique effectue est la prédiction des probabilités. Cela peut être utile dans de nombreuses tâches lorsque nous avons besoin de savoir à quel point le modèle est confiant dans ses prédictions.

Pour résumer, voici un tableau avec les avantages et les inconvénients de la régression logistique.

AvantagesInconvénients
Entraînement rapideAvec régularisation, nécessite une mise à l'échelle des caractéristiques
S'adapte bien à un grand nombre d'instances d'entraînementFrontière de décision linéaire sans les PolynomialFeatures
Facile d'ajouter de nouvelles données d'entraînementNe fonctionne pas bien avec un grand nombre de caractéristiques
Prédictions rapidesSujet au surapprentissage, surtout avec PolynomialFeatures
Prédit des probabilités

Dans l'ensemble, la régression logistique est un bon algorithme pour des tâches simples avec peu de caractéristiques. Mais elle gère mal les données avec de nombreuses caractéristiques.

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 2. Chapitre 7
We're sorry to hear that something went wrong. What happened?
some-alt