Utfordring: Bag of Words
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:
- Importer klassen
CountVectorizerfor å lage en BoW-modell. - Instansier klassen
CountVectorizersomcount_vectorizer, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer. - Bruk riktig metode fra
count_vectorizerfor å generere en BoW-matrise fra kolonnen'Document'icorpus, og lagre resultatet ibow_matrix. - Konverter
bow_matrixtil et tett array og opprett enDataFramefra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 5
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.45
Utfordring: Bag of Words
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Din oppgave er å vise vektoren for bigrammet 'graphic design' i en BoW-modell. For å gjøre dette:
- Importer klassen
CountVectorizerfor å lage en BoW-modell. - Instansier klassen
CountVectorizersomcount_vectorizer, og konfigurer den for en frekvensbasert modell som inkluderer både unigrammer og bigrammer. - Bruk riktig metode fra
count_vectorizerfor å generere en BoW-matrise fra kolonnen'Document'icorpus, og lagre resultatet ibow_matrix. - Konverter
bow_matrixtil et tett array og opprett enDataFramefra dette, med de unike trekkene (unigrammer og bigrammer) som kolonner. Lagre resultatet i variabelenbow_df. - Vis vektoren for bigrammet
'graphic design'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 5
single