Desafío: TF-IDF
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importa la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancia la clase
TfidfVectorizercomotfidf_vectorizery configúrala para incluir unigrams, bigrams y trigrams. - Utiliza el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy guarda el resultado entfidf_matrix. - Convierte
tfidf_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Guarda el resultado en la variabletfidf_matrix_df. - Muestra el vector para
'medical'como un array.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Can you explain this in simpler terms?
What are some examples related to this topic?
Where can I learn more about this?
Genial!
Completion tasa mejorada a 3.45
Desafío: TF-IDF
Desliza para mostrar el menú
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el unigram 'medical' en un modelo TF-IDF que incluya unigrams, bigrams y trigrams. Para ello:
- Importa la clase
TfidfVectorizerpara crear un modelo TF-IDF. - Instancia la clase
TfidfVectorizercomotfidf_vectorizery configúrala para incluir unigrams, bigrams y trigrams. - Utiliza el método apropiado de
tfidf_vectorizerpara generar una matriz TF-IDF a partir de la columna'Document'en elcorpusy guarda el resultado entfidf_matrix. - Convierte
tfidf_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (términos) como columnas. Guarda el resultado en la variabletfidf_matrix_df. - Muestra el vector para
'medical'como un array.
Solución
¡Gracias por tus comentarios!
single