Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Qu'est-ce que le k-NN | Classificateur k-NN
Classification avec Python

bookQu'est-ce que le k-NN

Commençons notre exploration de la classification par la tâche la plus simple : la classification binaire. Supposons que nous souhaitions classer des confiseries en biscuits/non biscuits en fonction d’une seule caractéristique : leur poids.

Une méthode simple pour prédire la classe d’un nouvel échantillon consiste à examiner son voisin le plus proche. Dans notre exemple, il s’agit de trouver la confiserie dont le poids est le plus similaire à celui du nouvel échantillon.

C’est le principe des k plus proches voisins (k-NN) : il suffit d’observer les voisins. L’algorithme k-NN suppose que des éléments similaires se trouvent à proximité les uns des autres. En d’autres termes, les éléments similaires sont proches. Le k dans k-NN représente le nombre de voisins pris en compte lors de la prédiction.

Dans l'exemple ci-dessus, nous avons considéré uniquement 1 voisin, il s'agissait donc du plus proche voisin (1-Nearest Neighbor). Cependant, k est généralement fixé à une valeur plus élevée, car se baser sur un seul voisin peut être peu fiable :

Si k (nombre de voisins) est supérieur à un, la classe la plus fréquente dans le voisinage est choisie comme prédiction. Voici un exemple de prédiction de deux nouvelles instances avec k=3 :

Comme vous pouvez le constater, modifier la valeur de k peut entraîner des prédictions différentes.

Note
Note

Parfois, k-NN produit une égalité lorsque plusieurs classes apparaissent en nombre égal parmi les voisins les plus proches. La plupart des bibliothèques, y compris scikit-learn, résolvent les égalités en choisissant la première classe selon leur ordre interne — un point à garder à l'esprit, car cela peut subtilement influencer la reproductibilité et l'interprétation.

question mark

Dans l'algorithme des k plus proches voisins, comment la classe d'une nouvelle instance est-elle prédite lorsque k > 1 ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 2

Demandez à l'IA

expand

Demandez à l'IA

ChatGPT

Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion

Awesome!

Completion rate improved to 4.17

bookQu'est-ce que le k-NN

Glissez pour afficher le menu

Commençons notre exploration de la classification par la tâche la plus simple : la classification binaire. Supposons que nous souhaitions classer des confiseries en biscuits/non biscuits en fonction d’une seule caractéristique : leur poids.

Une méthode simple pour prédire la classe d’un nouvel échantillon consiste à examiner son voisin le plus proche. Dans notre exemple, il s’agit de trouver la confiserie dont le poids est le plus similaire à celui du nouvel échantillon.

C’est le principe des k plus proches voisins (k-NN) : il suffit d’observer les voisins. L’algorithme k-NN suppose que des éléments similaires se trouvent à proximité les uns des autres. En d’autres termes, les éléments similaires sont proches. Le k dans k-NN représente le nombre de voisins pris en compte lors de la prédiction.

Dans l'exemple ci-dessus, nous avons considéré uniquement 1 voisin, il s'agissait donc du plus proche voisin (1-Nearest Neighbor). Cependant, k est généralement fixé à une valeur plus élevée, car se baser sur un seul voisin peut être peu fiable :

Si k (nombre de voisins) est supérieur à un, la classe la plus fréquente dans le voisinage est choisie comme prédiction. Voici un exemple de prédiction de deux nouvelles instances avec k=3 :

Comme vous pouvez le constater, modifier la valeur de k peut entraîner des prédictions différentes.

Note
Note

Parfois, k-NN produit une égalité lorsque plusieurs classes apparaissent en nombre égal parmi les voisins les plus proches. La plupart des bibliothèques, y compris scikit-learn, résolvent les égalités en choisissant la première classe selon leur ordre interne — un point à garder à l'esprit, car cela peut subtilement influencer la reproductibilité et l'interprétation.

question mark

Dans l'algorithme des k plus proches voisins, comment la classe d'une nouvelle instance est-elle prédite lorsque k > 1 ?

Select the correct answer

Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 1. Chapitre 2
some-alt