Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Tokenisierung Mit Regex | Grundlagen der Textvorverarbeitung
Einführung in NLP
course content

Kursinhalt

Einführung in NLP

Einführung in NLP

1. Grundlagen der Textvorverarbeitung
2. Stemming und Lemmatisierung
3. Grundlegende Textmodelle
4. Wort-Einbettungen

book
Herausforderung: Tokenisierung Mit Regex

Aufgabe

Swipe to start coding

Gegeben ist ein String namens message, konvertiere ihn in Kleinbuchstaben und tokenisiere ihn dann in Wörter unter Verwendung der regulären Ausdruck-Tokenisierung und der entsprechenden nltk-Klasse. Ein Wort ist eine Sequenz von nur alphanumerischen Zeichen (Buchstaben und Zahlen). '#Conference2023!' enthält zum Beispiel ein Wort: Conference2023.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
toggle bottom row

book
Herausforderung: Tokenisierung Mit Regex

Aufgabe

Swipe to start coding

Gegeben ist ein String namens message, konvertiere ihn in Kleinbuchstaben und tokenisiere ihn dann in Wörter unter Verwendung der regulären Ausdruck-Tokenisierung und der entsprechenden nltk-Klasse. Ein Wort ist eine Sequenz von nur alphanumerischen Zeichen (Buchstaben und Zahlen). '#Conference2023!' enthält zum Beispiel ein Wort: Conference2023.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 6
Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
We're sorry to hear that something went wrong. What happened?
some-alt