Défi : Tokenisation avec Regex
Swipe to start coding
Un message est fourni dans la variable message. Vous devez le segmenter en mots à l'aide des expressions régulières. Pour cela :
- Importer la classe nécessaire.
- Convertir
messageen minuscules et enregistrer le résultat dansmessage_lower. - Créer un Regexp Tokenizer avec le bon motif et l'enregistrer dans
word_tokenizer. - Segmenter
message_loweren mots à l'aide deword_tokenizer.
Un mot est une suite de caractères alphanumériques et de soulignements. Par exemple, '#NLPConference_20!' contient un seul mot : NLPConference_20.
Solution
Merci pour vos commentaires !
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.45
Défi : Tokenisation avec Regex
Glissez pour afficher le menu
Swipe to start coding
Un message est fourni dans la variable message. Vous devez le segmenter en mots à l'aide des expressions régulières. Pour cela :
- Importer la classe nécessaire.
- Convertir
messageen minuscules et enregistrer le résultat dansmessage_lower. - Créer un Regexp Tokenizer avec le bon motif et l'enregistrer dans
word_tokenizer. - Segmenter
message_loweren mots à l'aide deword_tokenizer.
Un mot est une suite de caractères alphanumériques et de soulignements. Par exemple, '#NLPConference_20!' contient un seul mot : NLPConference_20.
Solution
Merci pour vos commentaires !
single