 Utmaning: Påse med Ord
Utmaning: Påse med Ord
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen CountVectorizerför att skapa en BoW-modell.
- Instansiera klassen CountVectorizersomcount_vectorizeroch konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram.
- Använd lämplig metod från count_vectorizerför att generera en BoW-matris från kolumnen'Document'icorpusoch spara resultatet ibow_matrix.
- Konvertera bow_matrixtill en tät array och skapa enDataFramefrån den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df.
- Visa vektorn för bigrammet 'graphic design'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.45 Utmaning: Påse med Ord
Utmaning: Påse med Ord
Svep för att visa menyn
Uppgift
Swipe to start coding
Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att visa vektorn för bigrammet 'graphic design' i en BoW-modell. För att göra detta:
- Importera klassen CountVectorizerför att skapa en BoW-modell.
- Instansiera klassen CountVectorizersomcount_vectorizeroch konfigurera den för en frekvensbaserad modell som inkluderar både unigram och bigram.
- Använd lämplig metod från count_vectorizerför att generera en BoW-matris från kolumnen'Document'icorpusoch spara resultatet ibow_matrix.
- Konvertera bow_matrixtill en tät array och skapa enDataFramefrån den, där de unika egenskaperna (unigram och bigram) används som kolumner. Spara resultatet i variabelnbow_df.
- Visa vektorn för bigrammet 'graphic design'som en array.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 3. Kapitel 5
single