Udfordring: Oprettelse af Word Embeddings
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at træne en Word2Vec-model til at generere word embeddings for det givne korpus. For at gøre dette:
- Importér klassen til oprettelse af en Word2Vec-model.
- Tokenisér hver sætning i kolonnen
'Document'icorpusved at opdele hver sætning i ord adskilt af mellemrum. Gem resultatet i variablensentences. - Initialisér Word2Vec-modellen ved at give
sentencessom første argument og indstille følgende parametre:- embedding-størrelse: 50;
- kontekstvinduesstørrelse: 2;
- minimal frekvens af ord for at inkludere dem i modellen: 1;
- model: skip-gram.
- Udskriv de tre mest lignende ord til ordet 'bowl'.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 4. Kapitel 4
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
Awesome!
Completion rate improved to 3.45
Udfordring: Oprettelse af Word Embeddings
Stryg for at vise menuen
Opgave
Swipe to start coding
Du har et tekstkorpus gemt i variablen corpus. Din opgave er at træne en Word2Vec-model til at generere word embeddings for det givne korpus. For at gøre dette:
- Importér klassen til oprettelse af en Word2Vec-model.
- Tokenisér hver sætning i kolonnen
'Document'icorpusved at opdele hver sætning i ord adskilt af mellemrum. Gem resultatet i variablensentences. - Initialisér Word2Vec-modellen ved at give
sentencessom første argument og indstille følgende parametre:- embedding-størrelse: 50;
- kontekstvinduesstørrelse: 2;
- minimal frekvens af ord for at inkludere dem i modellen: 1;
- model: skip-gram.
- Udskriv de tre mest lignende ord til ordet 'bowl'.
Løsning
Var alt klart?
Tak for dine kommentarer!
Sektion 4. Kapitel 4
single