Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Tokenisierung mit Regex | Grundlagen der Textvorverarbeitung
Einführung in NLP

bookHerausforderung: Tokenisierung mit Regex

Aufgabe

Swipe to start coding

Sie erhalten eine Nachricht in der Variable message. Sie sollen diese mithilfe von Regex in Wörter tokenisieren. Gehen Sie dazu wie folgt vor:

  1. Notwendige Klasse importieren.
  2. message in Kleinbuchstaben umwandeln und in message_lower speichern.
  3. Einen Regexp Tokenizer mit dem korrekten Muster erstellen und in word_tokenizer speichern.
  4. message_lower mit word_tokenizer in Wörter tokenisieren.

Ein Wort ist eine Folge von alphanumerischen Zeichen und Unterstrichen. '#NLPConference_20!' enthält zum Beispiel ein Wort: NLPConference_20.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookHerausforderung: Tokenisierung mit Regex

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie erhalten eine Nachricht in der Variable message. Sie sollen diese mithilfe von Regex in Wörter tokenisieren. Gehen Sie dazu wie folgt vor:

  1. Notwendige Klasse importieren.
  2. message in Kleinbuchstaben umwandeln und in message_lower speichern.
  3. Einen Regexp Tokenizer mit dem korrekten Muster erstellen und in word_tokenizer speichern.
  4. message_lower mit word_tokenizer in Wörter tokenisieren.

Ein Wort ist eine Folge von alphanumerischen Zeichen und Unterstrichen. '#NLPConference_20!' enthält zum Beispiel ein Wort: NLPConference_20.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
single

single

some-alt