Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Skapa Ordvektorer | Ordembeddingar
Introduktion till NLP

bookUtmaning: Skapa Ordvektorer

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att träna en Word2Vec-modell för att generera ordbäddningar för den givna korpusen. För att göra detta:

  1. Importera klassen för att skapa en Word2Vec-modell.
  2. Tokenisera varje mening i kolumnen 'Document' i corpus genom att dela upp varje mening i ord separerade med blanksteg. Spara resultatet i variabeln sentences.
  3. Initiera Word2Vec-modellen genom att skicka in sentences som första argument och ange följande parametrar:
    • inbäddningsstorlek: 50;
    • kontextfönsterstorlek: 2;
    • minsta frekvens för ord som ska inkluderas i modellen: 1;
    • modell: skip-gram.
  4. Skriv ut de tre mest liknande orden till ordet 'bowl'.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 4
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you explain this in simpler terms?

What are some examples related to this topic?

Where can I learn more about this?

close

Awesome!

Completion rate improved to 3.45

bookUtmaning: Skapa Ordvektorer

Svep för att visa menyn

Uppgift

Swipe to start coding

Du har en textkorpus lagrad i variabeln corpus. Din uppgift är att träna en Word2Vec-modell för att generera ordbäddningar för den givna korpusen. För att göra detta:

  1. Importera klassen för att skapa en Word2Vec-modell.
  2. Tokenisera varje mening i kolumnen 'Document' i corpus genom att dela upp varje mening i ord separerade med blanksteg. Spara resultatet i variabeln sentences.
  3. Initiera Word2Vec-modellen genom att skicka in sentences som första argument och ange följande parametrar:
    • inbäddningsstorlek: 50;
    • kontextfönsterstorlek: 2;
    • minsta frekvens för ord som ska inkluderas i modellen: 1;
    • modell: skip-gram.
  4. Skriv ut de tre mest liknande orden till ordet 'bowl'.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 4. Kapitel 4
single

single

some-alt