Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Apprendre Défi : Créer un Sac de Mots | Modèles de Texte de Base
Introduction au NLP
course content

Contenu du cours

Introduction au NLP

Introduction au NLP

1. Fondamentaux du Prétraitement de Texte
2. Racine et Lemmatisation
3. Modèles de Texte de Base
4. Incorporations de Mots

book
Défi : Créer un Sac de Mots

Tâche

Swipe to start coding

Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :

  1. Importez la classe CountVectorizer pour créer un modèle BoW.

  2. Instanciez la classe CountVectorizer en tant que count_vectorizer, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes.

  3. Utilisez la méthode appropriée de count_vectorizer pour générer une matrice BoW à partir de la colonne 'Document' dans le corpus.

  4. Convertissez bow_matrix en un tableau dense et créez un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variable bow_df.

  5. Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une Series pandas.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
toggle bottom row

book
Défi : Créer un Sac de Mots

Tâche

Swipe to start coding

Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :

  1. Importez la classe CountVectorizer pour créer un modèle BoW.

  2. Instanciez la classe CountVectorizer en tant que count_vectorizer, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes.

  3. Utilisez la méthode appropriée de count_vectorizer pour générer une matrice BoW à partir de la colonne 'Document' dans le corpus.

  4. Convertissez bow_matrix en un tableau dense et créez un DataFrame à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variable bow_df.

  5. Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une Series pandas.

Solution

Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
Tout était clair ?

Comment pouvons-nous l'améliorer ?

Merci pour vos commentaires !

Section 3. Chapitre 5
Switch to desktopPassez à un bureau pour une pratique réelleContinuez d'où vous êtes en utilisant l'une des options ci-dessous
We're sorry to hear that something went wrong. What happened?
some-alt