Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Bag of Words | Grundlæggende Tekstmodeller
Introduktion til NLP

bookUdfordring: Bag of Words

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:

  1. Importér klassen CountVectorizer for at oprette en BoW-model.
  2. Instantier CountVectorizer som count_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer.
  3. Brug den relevante metode fra count_vectorizer til at generere en BoW-matrix fra kolonnen 'Document' i corpus og gem resultatet i bow_matrix.
  4. Konverter bow_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 5
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Bag of Words

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:

  1. Importér klassen CountVectorizer for at oprette en BoW-model.
  2. Instantier CountVectorizer som count_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer.
  3. Brug den relevante metode fra count_vectorizer til at generere en BoW-matrix fra kolonnen 'Document' i corpus og gem resultatet i bow_matrix.
  4. Konverter bow_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 5
single

single

some-alt