Apprendre Qu'est-ce que le k-NN | Classificateur k-NN

Commençons notre exploration de la classification par la tâche la plus simple : la classification binaire. Supposons que nous souhaitions classer des confiseries en biscuits/non biscuits en fonction d’une seule caractéristique : leur poids.

Une méthode simple pour prédire la classe d’un nouvel échantillon consiste à examiner son voisin le plus proche. Dans notre exemple, il s’agit de trouver la confiserie dont le poids est le plus similaire à celui du nouvel échantillon.

C’est le principe des k plus proches voisins (k-NN) : il suffit d’observer les voisins. L’algorithme k-NN suppose que des éléments similaires se trouvent à proximité les uns des autres. En d’autres termes, les éléments similaires sont proches. Le k dans k-NN représente le nombre de voisins pris en compte lors de la prédiction.

Dans l'exemple ci-dessus, nous avons considéré uniquement 1 voisin, il s'agissait donc du plus proche voisin (1-Nearest Neighbor). Cependant, k est généralement fixé à une valeur plus élevée, car se baser sur un seul voisin peut être peu fiable :

Si k (nombre de voisins) est supérieur à un, la classe la plus fréquente dans le voisinage est choisie comme prédiction. Voici un exemple de prédiction de deux nouvelles instances avec k=3 :

Comme vous pouvez le constater, modifier la valeur de k peut entraîner des prédictions différentes.

Note

Parfois, k-NN produit une égalité lorsque plusieurs classes apparaissent en nombre égal parmi les voisins les plus proches. La plupart des bibliothèques, y compris scikit-learn, résolvent les égalités en choisissant la première classe selon leur ordre interne — un point à garder à l'esprit, car cela peut subtilement influencer la reproductibilité et l'interprétation.

Tout était clair ?

Merci pour vos commentaires !

Section 1. Chapitre 2

Demandez à l'IA

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.17

Glissez pour afficher le menu

Comme vous pouvez le constater, modifier la valeur de k peut entraîner des prédictions différentes.

Note

Tout était clair ?

Merci pour vos commentaires !

Section 1. Chapitre 2