Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Tokenisatie met Regex | Grondbeginselen van Tekstvoorbewerking
Introductie tot NLP

bookUitdaging: Tokenisatie met Regex

Taak

Swipe to start coding

Je krijgt een bericht in de variabele message. Je moet dit bericht in woorden tokenizen met behulp van regex. Volg hiervoor de volgende stappen:

  1. Importeer de benodigde klasse.
  2. Zet message om naar kleine letters en sla dit op in message_lower.
  3. Maak een Regexp Tokenizer aan met het juiste patroon en sla deze op in word_tokenizer.
  4. Tokenize message_lower in woorden met behulp van word_tokenizer.

Een woord is een reeks alfanumerieke tekens en underscores. '#NLPConference_20!' bevat bijvoorbeeld één woord: NLPConference_20.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 6
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.45

bookUitdaging: Tokenisatie met Regex

Veeg om het menu te tonen

Taak

Swipe to start coding

Je krijgt een bericht in de variabele message. Je moet dit bericht in woorden tokenizen met behulp van regex. Volg hiervoor de volgende stappen:

  1. Importeer de benodigde klasse.
  2. Zet message om naar kleine letters en sla dit op in message_lower.
  3. Maak een Regexp Tokenizer aan met het juiste patroon en sla deze op in word_tokenizer.
  4. Tokenize message_lower in woorden met behulp van word_tokenizer.

Een woord is een reeks alfanumerieke tekens en underscores. '#NLPConference_20!' bevat bijvoorbeeld één woord: NLPConference_20.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 1. Hoofdstuk 6
single

single

some-alt