Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Useiden Elementtien Attribuutit ja Sisällöt | Elementtien Attribuuttien Käsittely Beautiful Soupissa
Web Scraping Pythonilla

bookUseiden Elementtien Attribuutit ja Sisällöt

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-menetelmän tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja menetelmiin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

Can you explain how the `.attrs` attribute works in BeautifulSoup?

What other tags can I use with `.find_all()` besides `<div>` and `<p>`?

How can I filter elements by class or id using BeautifulSoup?

Awesome!

Completion rate improved to 4.35

bookUseiden Elementtien Attribuutit ja Sisällöt

Pyyhkäise näyttääksesi valikon

Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-menetelmän tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja menetelmiin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
copy

Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.

12345678910111213
# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
copy
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 3
some-alt