Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Stemming | Stemming und Lemmatisierung
Einführung in NLP

bookHerausforderung: Stemming

Aufgabe

Swipe to start coding

Sie erhalten einen Text in der Variable text. Ihre Aufgabe ist es, diesen Text zu tokenisieren, die Stoppwörter zu entfernen und das Stemming auf die Tokens anzuwenden. Gehen Sie dazu wie folgt vor:

  1. Importieren Sie den Porter Stemmer.
  2. Konvertieren Sie text in Kleinbuchstaben und speichern Sie das Ergebnis in text_lower.
  3. Tokenisieren Sie den String text_lower und speichern Sie das Ergebnis in tokens.
  4. Laden Sie die englischen Stoppwörter, konvertieren Sie sie in ein set und speichern Sie sie in stop_words.
  5. Filtern Sie die Stoppwörter mithilfe einer List Comprehension heraus und speichern Sie das Ergebnis in filtered_tokens.
  6. Erstellen Sie einen Porter Stemmer und speichern Sie ihn in stemmer.
  7. Wenden Sie das Stemming auf die Tokens mithilfe einer List Comprehension an und speichern Sie das Ergebnis in stemmed_tokens.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.45

bookHerausforderung: Stemming

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie erhalten einen Text in der Variable text. Ihre Aufgabe ist es, diesen Text zu tokenisieren, die Stoppwörter zu entfernen und das Stemming auf die Tokens anzuwenden. Gehen Sie dazu wie folgt vor:

  1. Importieren Sie den Porter Stemmer.
  2. Konvertieren Sie text in Kleinbuchstaben und speichern Sie das Ergebnis in text_lower.
  3. Tokenisieren Sie den String text_lower und speichern Sie das Ergebnis in tokens.
  4. Laden Sie die englischen Stoppwörter, konvertieren Sie sie in ein set und speichern Sie sie in stop_words.
  5. Filtern Sie die Stoppwörter mithilfe einer List Comprehension heraus und speichern Sie das Ergebnis in filtered_tokens.
  6. Erstellen Sie einen Porter Stemmer und speichern Sie ihn in stemmer.
  7. Wenden Sie das Stemming auf die Tokens mithilfe einer List Comprehension an und speichern Sie das Ergebnis in stemmed_tokens.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 2
single

single

some-alt