Défi : Créer un Sac de Mots
Swipe to start coding
Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :
-
Importez la classe
CountVectorizer
pour créer un modèle BoW. -
Instanciez la classe
CountVectorizer
en tant quecount_vectorizer
, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes. -
Utilisez la méthode appropriée de
count_vectorizer
pour générer une matrice BoW à partir de la colonne'Document'
dans lecorpus
. -
Convertissez
bow_matrix
en un tableau dense et créez unDataFrame
à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variablebow_df
. -
Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une
Series
pandas.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Résumer ce chapitre
Expliquer le code dans file
Expliquer pourquoi file ne résout pas la tâche
Awesome!
Completion rate improved to 3.45
Défi : Créer un Sac de Mots
Glissez pour afficher le menu
Swipe to start coding
Votre tâche consiste à afficher le vecteur pour le bigramme 'graphic design' dans un modèle BoW :
-
Importez la classe
CountVectorizer
pour créer un modèle BoW. -
Instanciez la classe
CountVectorizer
en tant quecount_vectorizer
, en le configurant pour un modèle basé sur la fréquence qui inclut à la fois des unigrammes et des bigrammes. -
Utilisez la méthode appropriée de
count_vectorizer
pour générer une matrice BoW à partir de la colonne'Document'
dans lecorpus
. -
Convertissez
bow_matrix
en un tableau dense et créez unDataFrame
à partir de celui-ci, en définissant les caractéristiques uniques (unigrammes et bigrammes) comme ses colonnes. Assignez cela à la variablebow_df
. -
Affichez le vecteur pour 'graphic design' sous forme de tableau, plutôt que comme une
Series
pandas.
Solution
Merci pour vos commentaires !
Awesome!
Completion rate improved to 3.45single