Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Tokenisointi Säännöllisillä Lausekkeilla | Tekstin Esikäsittelyn Perusteet
Johdatus NLP:hen

bookHaaste: Tokenisointi Säännöllisillä Lausekkeilla

Tehtävä

Swipe to start coding

Sinulle annetaan viesti muuttujassa message. Sinun tulee pilkkoa se sanoiksi käyttäen säännöllisiä lausekkeita. Toimi näin:

  1. Tuo tarvittava luokka.
  2. Muunna message pieniksi kirjaimiksi ja tallenna se muuttujaan message_lower.
  3. Luo Regexp Tokenizer oikealla kaavalla ja tallenna se muuttujaan word_tokenizer.
  4. Pilko message_lower sanoiksi käyttäen word_tokenizer-muuttujaa.

Sana on kirjain-, numero- tai alaviivamerkkien jono. Esimerkiksi '#NLPConference_20!' sisältää yhden sanan: NLPConference_20.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookHaaste: Tokenisointi Säännöllisillä Lausekkeilla

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulle annetaan viesti muuttujassa message. Sinun tulee pilkkoa se sanoiksi käyttäen säännöllisiä lausekkeita. Toimi näin:

  1. Tuo tarvittava luokka.
  2. Muunna message pieniksi kirjaimiksi ja tallenna se muuttujaan message_lower.
  3. Luo Regexp Tokenizer oikealla kaavalla ja tallenna se muuttujaan word_tokenizer.
  4. Pilko message_lower sanoiksi käyttäen word_tokenizer-muuttujaa.

Sana on kirjain-, numero- tai alaviivamerkkien jono. Esimerkiksi '#NLPConference_20!' sisältää yhden sanan: NLPConference_20.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 6
single

single

some-alt