Summary  
This chapter explains how to search and filter HTML elements by tag and attribute using BeautifulSoup’s .find_all() and .find() methods, and retrieve specific attribute values with .attrs.get(). It covers passing attribute–value pairs to locate elements with certain classes or ids and highlights the use of .find() for unique id selection.  

General domain of usage  
Web scraping

Деякі **HTML**-теги вимагають обов'язкових атрибутів, наприклад, тег посилання потребує атрибут `href`, а тег `<img>` — атрибут `src`. Для доступу до конкретного атрибута використовуйте метод `.get()` після `.attrs`. Наприклад, отримайте всі атрибути `src` з усіх елементів `<img>`.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for img in soup.find_all("img"):
  print(img.attrs.get("src"))

Ви також можете зустріти атрибут `id`, який часто використовується для розрізнення елементів з однаковим тегом. Щоб шукати елементи з певними значеннями атрибутів, передайте їх у вигляді словника у форматі `attr_name: attr_value` до методу `.find_all()` одразу після вказання тегу. Наприклад, знайдіть усі елементи `<div>` з атрибутом `class`, що дорівнює `"box"`, або елемент `<p>` з атрибутом `"id"` зі значенням `"id2"`.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for div in soup.find_all("div", {"class": "box"}):
  print(div)

# Filtering by id attribute value
print(soup.find("p", {"id": "id2"}))

Метод `.find()` використовується замість `.find_all()` для отримання елемента за його `id`, оскільки `id` є унікальним ідентифікатором і не може повторюватися. Щоб переконатися, що були отримані лише певні елементи `<div>`, перевірте класи, призначені цим елементам `<div>`.


# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/page.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
for div in soup.find_all("div"):
  print(div.attrs.get("class"))

Навчіться автоматично отримувати цінні дані з вебсайтів. Опануйте методи ефективного збору інформації, що дозволить проводити глибокий аналіз, приймати рішення на основі даних і відкривати нові інсайти з величезного обсягу онлайн-інформації.

Дослідження структури HTML-файлу, ефективне завантаження та набуття практичних навичок роботи з його даними.

Ознайомлення з основами Beautiful Soup для вилучення даних із HTML-документів. Вивчення структури HTML, доступ до конкретних елементів і робота з їх дочірніми елементами для формування ґрунтовної бази у веб-скрапінгу.

Опанування роботи з атрибутами елементів та вмістом за допомогою Beautiful Soup. Формування навичок вилучення конкретної інформації, пошуку елементів за значеннями атрибутів і застосування розширених методів для ефективного парсингу та аналізу HTML-даних.

Розширений пошук