Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Stemming | Stamme- og Lemmatisering
Introduktion til NLP

bookUdfordring: Stemming

Opgave

Swipe to start coding

Du får en tekst i variablen text. Din opgave er at tokenisere denne tekst, fjerne stopord og anvende stemming på tokens. For at gøre dette:

  1. Importér Porter Stemmer.
  2. Konverter text til små bogstaver og gem det i text_lower.
  3. Tokenisér strengen text_lower og gem resultatet i tokens.
  4. Indlæs engelske stopord, konverter dem til et set, og gem dem i stop_words.
  5. Filtrér stopordene fra ved hjælp af list comprehension og gem resultatet i filtered_tokens.
  6. Opret en Porter Stemmer og gem den i stemmer.
  7. Anvend stemming på tokens ved hjælp af list comprehension og gem resultatet i stemmed_tokens.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 2
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

close

Awesome!

Completion rate improved to 3.45

bookUdfordring: Stemming

Stryg for at vise menuen

Opgave

Swipe to start coding

Du får en tekst i variablen text. Din opgave er at tokenisere denne tekst, fjerne stopord og anvende stemming på tokens. For at gøre dette:

  1. Importér Porter Stemmer.
  2. Konverter text til små bogstaver og gem det i text_lower.
  3. Tokenisér strengen text_lower og gem resultatet i tokens.
  4. Indlæs engelske stopord, konverter dem til et set, og gem dem i stop_words.
  5. Filtrér stopordene fra ved hjælp af list comprehension og gem resultatet i filtered_tokens.
  6. Opret en Porter Stemmer og gem den i stemmer.
  7. Anvend stemming på tokens ved hjælp af list comprehension og gem resultatet i stemmed_tokens.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 2. Kapitel 2
single

single

some-alt