Useiden Elementtien Attribuutit ja Sisällöt
Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-menetelmän tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja menetelmiin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Can you explain how the `.attrs` attribute works in BeautifulSoup?
What other tags can I use with `.find_all()` besides `<div>` and `<p>`?
How can I filter elements by class or id using BeautifulSoup?
Awesome!
Completion rate improved to 4.35
Useiden Elementtien Attribuutit ja Sisällöt
Pyyhkäise näyttääksesi valikon
Kaikkia edellisessä luvussa käsiteltyjä menetelmiä voidaan soveltaa tietyn tunnisteen omaaviin elementteihin, eli .find_all()-menetelmän tulokseen. Koska .find_all() palauttaa listan, täytyy ominaisuuksiin ja menetelmiin päästä käsiksi jokaisen elementin kohdalla erikseen. Käytä tähän tarkoitukseen for-silmukkaa. Esimerkiksi, hae kaikkien <div>-elementtien kaikki attribuutit.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
Sama lähestymistapa toimii tekstin poimimiseen. Esimerkiksi, hae kaikki tekstit jokaisesta <p>-elementistä.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Kiitos palautteestasi!