Défi : Création d'Embeddings de Mots
Tâche
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importer la classe permettant de créer un modèle Word2Vec.
- Tokeniser chaque phrase de la colonne
'Document'ducorpusen séparant chaque phrase en mots séparés par des espaces. Stocker le résultat dans la variablesentences. - Initialiser le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Afficher les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 3.45
Défi : Création d'Embeddings de Mots
Glissez pour afficher le menu
Tâche
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importer la classe permettant de créer un modèle Word2Vec.
- Tokeniser chaque phrase de la colonne
'Document'ducorpusen séparant chaque phrase en mots séparés par des espaces. Stocker le résultat dans la variablesentences. - Initialiser le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Afficher les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4
single