Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Challenge 2 | Moving on to Tasks
Data Preprocessing
course content

Зміст курсу

Data Preprocessing

Data Preprocessing

1. Brief Introduction
2. Processing Quantitative Data
3. Processing Categorical Data
4. Time Series Data Processing
5. Feature Engineering
6. Moving on to Tasks

Challenge 2

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 6. Розділ 2
toggle bottom row

Challenge 2

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Секція 6. Розділ 2
toggle bottom row

Challenge 2

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів

Все було зрозуміло?

Завдання

So, now let's remember what we do with text data. You will be working with the 'reviews.csv' dataset, and your task will be to encode text data using the bag of words method.

  1. Create a CountVectorizer object to tokenize text
  2. Fit data to the tokenizer
  3. Print the vocabulary of the tokenizer
  4. Encode 'Text' column
  5. Print the results

Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Секція 6. Розділ 2
Перейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
We're sorry to hear that something went wrong. What happened?
some-alt