Défi : Création d'Embeddings de Mots
Tâche
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importez la classe permettant de créer un modèle Word2Vec.
- Tokenisez chaque phrase de la colonne
'Document'ducorpusen divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences. - Initialisez le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Affichez les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4
single
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Génial!
Completion taux amélioré à 3.45
Défi : Création d'Embeddings de Mots
Glissez pour afficher le menu
Tâche
Swipe to start coding
Vous disposez d'un corpus de texte stocké dans la variable corpus. Votre tâche consiste à entraîner un modèle Word2Vec afin de générer des embeddings de mots pour ce corpus. Pour cela :
- Importez la classe permettant de créer un modèle Word2Vec.
- Tokenisez chaque phrase de la colonne
'Document'ducorpusen divisant chaque phrase en mots séparés par des espaces. Stockez le résultat dans la variablesentences. - Initialisez le modèle Word2Vec en passant
sentencescomme premier argument et en définissant les paramètres suivants :- taille des embeddings : 50 ;
- taille de la fenêtre de contexte : 2 ;
- fréquence minimale des mots à inclure dans le modèle : 1 ;
- modèle : skip-gram.
- Affichez les 3 mots les plus similaires au mot 'bowl'.
Solution
Tout était clair ?
Merci pour vos commentaires !
Section 4. Chapitre 4
single