Kursinhalt
Einführung in NLP
Einführung in NLP
Herausforderung: Erstellung eines Bag of Words
Swipe to start coding
Ihre Aufgabe besteht darin, den Vektor für das Bigramm 'graphic design' in einem BoW-Modell anzuzeigen:
-
Importieren Sie die
CountVectorizer
-Klasse, um ein BoW-Modell zu erstellen. -
Instanziieren Sie die
CountVectorizer
-Klasse alscount_vectorizer
und konfigurieren Sie sie für ein frequenzbasiertes Modell, das sowohl Unigramme als auch Bigramme umfasst. -
Verwenden Sie die geeignete Methode von
count_vectorizer
, um eine BoW-Matrix aus der'Document'
-Spalte imcorpus
zu erzeugen. -
Konvertieren Sie
bow_matrix
in ein dichtes Array und erstellen Sie einDataFrame
daraus, indem Sie die einzigartigen Merkmale (Unigramme und Bigramme) als Spalten festlegen. Weisen Sie dies der Variablenbow_df
zu. -
Zeigen Sie den Vektor für 'graphic design' als Array an, anstatt als pandas
Series
.
Lösung
Danke für Ihr Feedback!
Herausforderung: Erstellung eines Bag of Words
Swipe to start coding
Ihre Aufgabe besteht darin, den Vektor für das Bigramm 'graphic design' in einem BoW-Modell anzuzeigen:
-
Importieren Sie die
CountVectorizer
-Klasse, um ein BoW-Modell zu erstellen. -
Instanziieren Sie die
CountVectorizer
-Klasse alscount_vectorizer
und konfigurieren Sie sie für ein frequenzbasiertes Modell, das sowohl Unigramme als auch Bigramme umfasst. -
Verwenden Sie die geeignete Methode von
count_vectorizer
, um eine BoW-Matrix aus der'Document'
-Spalte imcorpus
zu erzeugen. -
Konvertieren Sie
bow_matrix
in ein dichtes Array und erstellen Sie einDataFrame
daraus, indem Sie die einzigartigen Merkmale (Unigramme und Bigramme) als Spalten festlegen. Weisen Sie dies der Variablenbow_df
zu. -
Zeigen Sie den Vektor für 'graphic design' als Array an, anstatt als pandas
Series
.
Lösung
Danke für Ihr Feedback!