Utmaning: Tokenisering med Regex
Uppgift
Swipe to start coding
Du får ett meddelande i variabeln message. Du ska tokenisera det till ord med hjälp av regex. För att göra detta:
- Importera nödvändig klass.
- Konvertera
messagetill små bokstäver och spara imessage_lower. - Skapa en Regexp Tokenizer med korrekt mönster och spara den i
word_tokenizer. - Tokenisera
message_lowertill ord med hjälp avword_tokenizer.
Ett ord är en sekvens av alfanumeriska tecken och understreck. '#NLPConference_20!' innehåller till exempel ett ord: NLPConference_20.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 6
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.45
Utmaning: Tokenisering med Regex
Svep för att visa menyn
Uppgift
Swipe to start coding
Du får ett meddelande i variabeln message. Du ska tokenisera det till ord med hjälp av regex. För att göra detta:
- Importera nödvändig klass.
- Konvertera
messagetill små bokstäver och spara imessage_lower. - Skapa en Regexp Tokenizer med korrekt mönster och spara den i
word_tokenizer. - Tokenisera
message_lowertill ord med hjälp avword_tokenizer.
Ett ord är en sekvens av alfanumeriska tecken och understreck. '#NLPConference_20!' innehåller till exempel ett ord: NLPConference_20.
Lösning
Var allt tydligt?
Tack för dina kommentarer!
Avsnitt 1. Kapitel 6
single