Udfordring: Tokenisering med Regex
Opgave
Swipe to start coding
Du får en besked i variablen message. Du skal opdele den i ord ved hjælp af regex. For at gøre dette:
- Importér den nødvendige klasse.
- Konverter
messagetil små bogstaver og gem det imessage_lower. - Opret en Regexp Tokenizer med det korrekte mønster og gem den i
word_tokenizer. - Opdel
message_loweri ord ved hjælp afword_tokenizer.
Et ord er en sekvens af alfanumeriske tegn og underscores. For eksempel indeholder '#NLPConference_20!' ét ord: NLPConference_20.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 1. Kapitel 6
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.45
Udfordring: Tokenisering med Regex
Stryg for at vise menuen
Opgave
Swipe to start coding
Du får en besked i variablen message. Du skal opdele den i ord ved hjælp af regex. For at gøre dette:
- Importér den nødvendige klasse.
- Konverter
messagetil små bogstaver og gem det imessage_lower. - Opret en Regexp Tokenizer med det korrekte mønster og gem den i
word_tokenizer. - Opdel
message_loweri ord ved hjælp afword_tokenizer.
Et ord er en sekvens af alfanumeriske tegn og underscores. For eksempel indeholder '#NLPConference_20!' ét ord: NLPConference_20.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 1. Kapitel 6
single