Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Tokenisering med Regex | Grunnleggende Tekstforbehandling
Introduksjon til NLP

bookUtfordring: Tokenisering med Regex

Oppgave

Swipe to start coding

Du får en melding i variabelen message. Du skal dele den opp i ord ved hjelp av regex. For å gjøre dette:

  1. Importer nødvendig klasse.
  2. Konverter message til små bokstaver og lagre i message_lower.
  3. Opprett en Regexp Tokenizer med riktig mønster og lagre den i word_tokenizer.
  4. Del opp message_lower i ord ved å bruke word_tokenizer.

Et ord er en sekvens av alfanumeriske tegn og understreker. For eksempel inneholder '#NLPConference_20!' ett ord: NLPConference_20.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 6
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookUtfordring: Tokenisering med Regex

Sveip for å vise menyen

Oppgave

Swipe to start coding

Du får en melding i variabelen message. Du skal dele den opp i ord ved hjelp av regex. For å gjøre dette:

  1. Importer nødvendig klasse.
  2. Konverter message til små bokstaver og lagre i message_lower.
  3. Opprett en Regexp Tokenizer med riktig mønster og lagre den i word_tokenizer.
  4. Del opp message_lower i ord ved å bruke word_tokenizer.

Et ord er en sekvens av alfanumeriske tegn og understreker. For eksempel inneholder '#NLPConference_20!' ett ord: NLPConference_20.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 1. Kapittel 6
single

single

some-alt