Desafío: Bolsa de Palabras
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importa la clase
CountVectorizerpara crear un modelo BoW. - Instancia la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utiliza el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'encorpusy guarda el resultado enbow_matrix. - Convierte
bow_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Guarda el resultado en la variablebow_df. - Muestra el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.45
Desafío: Bolsa de Palabras
Desliza para mostrar el menú
Tarea
Swipe to start coding
Tienes un corpus de texto almacenado en la variable corpus. Tu tarea es mostrar el vector para el bigrama 'graphic design' en un modelo BoW. Para ello:
- Importa la clase
CountVectorizerpara crear un modelo BoW. - Instancia la clase
CountVectorizercomocount_vectorizer, configurándola para un modelo basado en frecuencia que incluya tanto unigramas como bigramas. - Utiliza el método apropiado de
count_vectorizerpara generar una matriz BoW a partir de la columna'Document'encorpusy guarda el resultado enbow_matrix. - Convierte
bow_matrixa un array denso y crea unDataFramea partir de él, estableciendo las características únicas (unigramas y bigramas) como sus columnas. Guarda el resultado en la variablebow_df. - Muestra el vector para el bigrama
'graphic design'como un array.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 3. Capítulo 5
single