Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Вивчайте Завдання: Токенізація з Використанням Регулярних Виразів | Основи Попередньої Обробки Тексту
Вступ до NLP

bookЗавдання: Токенізація з Використанням Регулярних Виразів

Завдання

Swipe to start coding

Вам надано повідомлення у змінній message. Необхідно розбити його на слова за допомогою регулярних виразів. Для цього:

  1. Імпортуйте необхідний клас.
  2. Перетворіть message у нижній регістр і збережіть у message_lower.
  3. Створіть Regexp Tokenizer з правильним шаблоном і збережіть у word_tokenizer.
  4. Розбийте message_lower на слова за допомогою word_tokenizer.

Слово — це послідовність алфавітно-цифрових символів та підкреслень. Наприклад, у '#NLPConference_20!' міститься одне слово: NLPConference_20.

Рішення

Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 6
single

single

Запитати АІ

expand

Запитати АІ

ChatGPT

Запитайте про що завгодно або спробуйте одне із запропонованих запитань, щоб почати наш чат

Suggested prompts:

Can you explain this in more detail?

What are the main benefits or drawbacks?

Can you give an example?

close

Awesome!

Completion rate improved to 3.45

bookЗавдання: Токенізація з Використанням Регулярних Виразів

Свайпніть щоб показати меню

Завдання

Swipe to start coding

Вам надано повідомлення у змінній message. Необхідно розбити його на слова за допомогою регулярних виразів. Для цього:

  1. Імпортуйте необхідний клас.
  2. Перетворіть message у нижній регістр і збережіть у message_lower.
  3. Створіть Regexp Tokenizer з правильним шаблоном і збережіть у word_tokenizer.
  4. Розбийте message_lower на слова за допомогою word_tokenizer.

Слово — це послідовність алфавітно-цифрових символів та підкреслень. Наприклад, у '#NLPConference_20!' міститься одне слово: NLPConference_20.

Рішення

Switch to desktopПерейдіть на комп'ютер для реальної практикиПродовжуйте з того місця, де ви зупинились, використовуючи один з наведених нижче варіантів
Все було зрозуміло?

Як ми можемо покращити це?

Дякуємо за ваш відгук!

Секція 1. Розділ 6
single

single

some-alt