Udfordring: Bag of Words
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:
- Importér klassen
CountVectorizerfor at oprette en BoW-model. - Instantier
CountVectorizersomcount_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer. - Brug den relevante metode fra
count_vectorizertil at generere en BoW-matrix fra kolonnen'Document'icorpusog gem resultatet ibow_matrix. - Konverter
bow_matrixtil et tæt array og opret enDataFrameud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 3. Kapitel 5
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Suggested prompts:
Can you explain this in simpler terms?
What are the main points I should remember?
Can you give me an example?
Awesome!
Completion rate improved to 3.45
Udfordring: Bag of Words
Stryg for at vise menuen
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:
- Importér klassen
CountVectorizerfor at oprette en BoW-model. - Instantier
CountVectorizersomcount_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer. - Brug den relevante metode fra
count_vectorizertil at generere en BoW-matrix fra kolonnen'Document'icorpusog gem resultatet ibow_matrix. - Konverter
bow_matrixtil et tæt array og opret enDataFrameud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 3. Kapitel 5
single