Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Bag of Words | Grundlæggende Tekstmodeller
Introduktion til NLP

bookUdfordring: Bag of Words

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:

  1. Importér klassen CountVectorizer for at oprette en BoW-model.
  2. Instantier CountVectorizer som count_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer.
  3. Brug den relevante metode fra count_vectorizer til at generere en BoW-matrix fra kolonnen 'Document' i corpus og gem resultatet i bow_matrix.
  4. Konverter bow_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 5
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

Can you explain this in simpler terms?

What are the main points I should remember?

Can you give me an example?

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Bag of Words

Stryg for at vise menuen

Opgave

Swipe to start coding

Du har et tekstkorpus gemt i variablen corpus. Din opgave er at vise vektoren for bigrammet 'graphic design' i en BoW-model. For at gøre dette:

  1. Importér klassen CountVectorizer for at oprette en BoW-model.
  2. Instantier CountVectorizer som count_vectorizer, konfigureret til en frekvensbaseret model, der inkluderer både unigrammer og bigrammer.
  3. Brug den relevante metode fra count_vectorizer til at generere en BoW-matrix fra kolonnen 'Document' i corpus og gem resultatet i bow_matrix.
  4. Konverter bow_matrix til et tæt array og opret en DataFrame ud fra dette, hvor de unikke features (unigrammer og bigrammer) sættes som kolonner. Gem resultatet i variablen bow_df.
  5. Vis vektoren for bigrammet 'graphic design' som et array.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 5
single

single

some-alt