Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Haaste: Sanapussimalli | Perustekstin Mallit
Johdatus NLP:hen Pythonilla

bookHaaste: Sanapussimalli

Tehtävä

Swipe to start coding

Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää CountVectorizer-bigramin vektori BoW-mallissa. Toimi seuraavasti:

  1. Tuo CountVectorizer-luokka BoW-mallin luomista varten.
  2. Luo count_vectorizer-olio nimellä count_vectorizer ja määritä se käyttämään frekvenssipohjaista mallia, joka sisältää sekä unigrammit että bigrammit.
  3. Käytä 'Document'-olion sopivaa metodia luodaksesi BoW-matriisin corpus-muuttujan bow_matrix-sarakkeesta ja tallenna tulos muuttujaan bow_matrix.
  4. Muunna DataFrame tiheäksi taulukoksi ja luo siitä bow_df, jossa uniikit piirteet (unigrammit ja bigrammit) ovat sarakkeina. Tallenna tulos muuttujaan 'graphic design'.
  5. Näytä bigramin vektori taulukkona.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 5
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain this in simpler terms?

What are the main points I should remember?

Can you give me an example?

close

bookHaaste: Sanapussimalli

Pyyhkäise näyttääksesi valikon

Tehtävä

Swipe to start coding

Sinulla on tekstikorpus tallennettuna muuttujaan corpus. Tehtävänäsi on näyttää CountVectorizer-bigramin vektori BoW-mallissa. Toimi seuraavasti:

  1. Tuo CountVectorizer-luokka BoW-mallin luomista varten.
  2. Luo count_vectorizer-olio nimellä count_vectorizer ja määritä se käyttämään frekvenssipohjaista mallia, joka sisältää sekä unigrammit että bigrammit.
  3. Käytä 'Document'-olion sopivaa metodia luodaksesi BoW-matriisin corpus-muuttujan bow_matrix-sarakkeesta ja tallenna tulos muuttujaan bow_matrix.
  4. Muunna DataFrame tiheäksi taulukoksi ja luo siitä bow_df, jossa uniikit piirteet (unigrammit ja bigrammit) ovat sarakkeina. Tallenna tulos muuttujaan 'graphic design'.
  5. Näytä bigramin vektori taulukkona.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 5
single

single

some-alt