Summary  
Demonstrates how to use a Python HTML parsing library to load raw or fetched HTML into a structured object model, navigate its elements, and format the output using methods like .prettify().  

General domain of usage  
Web scraping

`BeautifulSoup` — це __бібліотека Python__, яка надає широкі можливості для розбору __HTML__-сторінок. У попередньому розділі ви працювали з __HTML__ як зі строкою, що мало суттєві обмеження.

Щоб встановити `BeautifulSoup`, виконайте наступну команду у вашому терміналі або командному рядку: 
- `pip install beautifulsoup4`;
- Для початку роботи імпортуйте `BeautifulSoup` з пакету `bs4`:

`from bs4 import BeautifulSoup`.

# Importing the library
from bs4 import BeautifulSoup
print(BeautifulSoup)

Ця бібліотека призначена для роботи з файлами **HTML** і не обробляє посилання. Однак це можна реалізувати за допомогою `urlopen` з модуля `urllib.request`. Для початку парсингу передайте два параметри у функцію `BeautifulSoup`: файл **HTML** та парсер (використовуйте вбудований `html.parser`). Це створює об'єкт `BeautifulSoup`. Наприклад, відкрийте та прочитайте веб-сторінку.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(type(soup))
print(soup)

Перший метод для ознайомлення — це `.prettify()`, який відображає файл **HTML** як вкладену структуру даних.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.prettify())

Навчіться автоматично отримувати цінні дані з вебсайтів. Опануйте методи ефективного збору інформації, що дозволить проводити глибокий аналіз, приймати рішення на основі даних і відкривати нові інсайти з величезного обсягу онлайн-інформації.

Дослідження структури HTML-файлу, ефективне завантаження та набуття практичних навичок роботи з його даними.

Ознайомлення з основами Beautiful Soup для вилучення даних із HTML-документів. Вивчення структури HTML, доступ до конкретних елементів і робота з їх дочірніми елементами для формування ґрунтовної бази у веб-скрапінгу.

Опанування роботи з атрибутами елементів та вмістом за допомогою Beautiful Soup. Формування навичок вилучення конкретної інформації, пошуку елементів за значеннями атрибутів і застосування розширених методів для ефективного парсингу та аналізу HTML-даних.

Що таке Beautiful Soup?