Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Erstellung von Wort-Embeddings | Wort-Einbettungen
Einführung in NLP

bookHerausforderung: Erstellung von Wort-Embeddings

Aufgabe

Swipe to start coding

Sie verfügen über ein Textkorpus, das in der Variable corpus gespeichert ist. Ihre Aufgabe ist es, ein Word2Vec-Modell zu trainieren, um Wort-Embeddings für das gegebene Korpus zu erzeugen. Gehen Sie dazu wie folgt vor:

  1. Importieren Sie die Klasse zur Erstellung eines Word2Vec-Modells.
  2. Tokenisieren Sie jeden Satz in der Spalte 'Document' des corpus, indem Sie jeden Satz in durch Leerzeichen getrennte Wörter aufteilen. Speichern Sie das Ergebnis in der Variable sentences.
  3. Initialisieren Sie das Word2Vec-Modell, indem Sie sentences als erstes Argument übergeben und folgende Parameter setzen:
    • Embedding-Größe: 50;
    • Kontextfenstergröße: 2;
    • Minimale Wortfrequenz für die Aufnahme ins Modell: 1;
    • Modell: Skip-Gram.
  4. Geben Sie die drei ähnlichsten Wörter zum Wort 'bowl' aus.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 4
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

close

Awesome!

Completion rate improved to 3.45

bookHerausforderung: Erstellung von Wort-Embeddings

Swipe um das Menü anzuzeigen

Aufgabe

Swipe to start coding

Sie verfügen über ein Textkorpus, das in der Variable corpus gespeichert ist. Ihre Aufgabe ist es, ein Word2Vec-Modell zu trainieren, um Wort-Embeddings für das gegebene Korpus zu erzeugen. Gehen Sie dazu wie folgt vor:

  1. Importieren Sie die Klasse zur Erstellung eines Word2Vec-Modells.
  2. Tokenisieren Sie jeden Satz in der Spalte 'Document' des corpus, indem Sie jeden Satz in durch Leerzeichen getrennte Wörter aufteilen. Speichern Sie das Ergebnis in der Variable sentences.
  3. Initialisieren Sie das Word2Vec-Modell, indem Sie sentences als erstes Argument übergeben und folgende Parameter setzen:
    • Embedding-Größe: 50;
    • Kontextfenstergröße: 2;
    • Minimale Wortfrequenz für die Aufnahme ins Modell: 1;
    • Modell: Skip-Gram.
  4. Geben Sie die drei ähnlichsten Wörter zum Wort 'bowl' aus.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 4. Kapitel 4
single

single

some-alt