 Utfordring: TF-IDF
Utfordring: TF-IDF
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:
- Importer klassen TfidfVectorizerfor å opprette en TF-IDF-modell.
- Instansier klassen TfidfVectorizersomtfidf_vectorizerog konfigurer den til å inkludere unigrammer, bigrammer og trigrammer.
- Bruk riktig metode fra tfidf_vectorizerfor å generere en TF-IDF-matrise fra kolonnen'Document'icorpus, og lagre resultatet itfidf_matrix.
- Konverter tfidf_matrixtil et tett array og opprett enDataFramefra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelentfidf_matrix_df.
- Vis vektoren for 'medical'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 8
single
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.45 Utfordring: TF-IDF
Utfordring: TF-IDF
Sveip for å vise menyen
Oppgave
Swipe to start coding
Du har et tekstkorpus lagret i variabelen corpus. Oppgaven din er å vise vektoren for unigrammet 'medical' i en TF-IDF-modell med unigrames, bigrames og trigrames. For å gjøre dette:
- Importer klassen TfidfVectorizerfor å opprette en TF-IDF-modell.
- Instansier klassen TfidfVectorizersomtfidf_vectorizerog konfigurer den til å inkludere unigrammer, bigrammer og trigrammer.
- Bruk riktig metode fra tfidf_vectorizerfor å generere en TF-IDF-matrise fra kolonnen'Document'icorpus, og lagre resultatet itfidf_matrix.
- Konverter tfidf_matrixtil et tett array og opprett enDataFramefra dette, der de unike trekkene (termene) settes som kolonner. Lagre resultatet i variabelentfidf_matrix_df.
- Vis vektoren for 'medical'som et array.
Løsning
Alt var klart?
Takk for tilbakemeldingene dine!
Seksjon 3. Kapittel 8
single