Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Leer Uitdaging: Het Creëren van Woordembeddings | Woordembeddings
Introductie tot NLP

bookUitdaging: Het Creëren van Woordembeddings

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. De opdracht is om een Word2Vec-model te trainen om woordembeddings voor het gegeven corpus te genereren. Volg hiervoor de volgende stappen:

  1. Importeer de klasse voor het aanmaken van een Word2Vec-model.
  2. Tokeniseer elke zin in de kolom 'Document' van het corpus door elke zin te splitsen in woorden gescheiden door spaties. Sla het resultaat op in de variabele sentences.
  3. Initialiseer het Word2Vec-model door sentences als eerste argument mee te geven en stel de volgende parameters in:
    • embeddinggrootte: 50;
    • contextvenstergrootte: 2;
    • minimale frequentie van woorden om op te nemen in het model: 1;
    • model: skip-gram.
  4. Print de top-3 meest vergelijkbare woorden met het woord 'bowl'.

Oplossing

Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 4
single

single

Vraag AI

expand

Vraag AI

ChatGPT

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

close

Awesome!

Completion rate improved to 3.45

bookUitdaging: Het Creëren van Woordembeddings

Veeg om het menu te tonen

Taak

Swipe to start coding

Je beschikt over een tekstcorpus opgeslagen in de variabele corpus. De opdracht is om een Word2Vec-model te trainen om woordembeddings voor het gegeven corpus te genereren. Volg hiervoor de volgende stappen:

  1. Importeer de klasse voor het aanmaken van een Word2Vec-model.
  2. Tokeniseer elke zin in de kolom 'Document' van het corpus door elke zin te splitsen in woorden gescheiden door spaties. Sla het resultaat op in de variabele sentences.
  3. Initialiseer het Word2Vec-model door sentences als eerste argument mee te geven en stel de volgende parameters in:
    • embeddinggrootte: 50;
    • contextvenstergrootte: 2;
    • minimale frequentie van woorden om op te nemen in het model: 1;
    • model: skip-gram.
  4. Print de top-3 meest vergelijkbare woorden met het woord 'bowl'.

Oplossing

Switch to desktopSchakel over naar desktop voor praktijkervaringGa verder vanaf waar je bent met een van de onderstaande opties
Was alles duidelijk?

Hoe kunnen we het verbeteren?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 4
single

single

some-alt