Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Tokenisering med Regex | Grunderna i Textförbehandling
Introduktion till NLP

bookUtmaning: Tokenisering med Regex

Uppgift

Swipe to start coding

Du får ett meddelande i variabeln message. Du ska tokenisera det till ord med hjälp av regex. För att göra detta:

  1. Importera nödvändig klass.
  2. Konvertera message till små bokstäver och spara i message_lower.
  3. Skapa en Regexp Tokenizer med korrekt mönster och spara den i word_tokenizer.
  4. Tokenisera message_lower till ord med hjälp av word_tokenizer.

Ett ord är en sekvens av alfanumeriska tecken och understreck. '#NLPConference_20!' innehåller till exempel ett ord: NLPConference_20.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 6
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

close

Awesome!

Completion rate improved to 3.45

bookUtmaning: Tokenisering med Regex

Svep för att visa menyn

Uppgift

Swipe to start coding

Du får ett meddelande i variabeln message. Du ska tokenisera det till ord med hjälp av regex. För att göra detta:

  1. Importera nödvändig klass.
  2. Konvertera message till små bokstäver och spara i message_lower.
  3. Skapa en Regexp Tokenizer med korrekt mönster och spara den i word_tokenizer.
  4. Tokenisera message_lower till ord med hjälp av word_tokenizer.

Ett ord är en sekvens av alfanumeriska tecken och understreck. '#NLPConference_20!' innehåller till exempel ett ord: NLPConference_20.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 1. Kapitel 6
single

single

some-alt