Attribut och Innehåll för Flera Element
Alla metoder som behandlades i föregående kapitel kan tillämpas på element med en specifik tagg, det vill säga på resultatet av metoden .find_all(). Eftersom .find_all() returnerar en lista måste du dock komma åt attribut och metoder för varje element separat. Använd en for-loop för detta ändamål. Till exempel, hämta alla attribut för alla <div>-element.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
Samma tillvägagångssätt fungerar för att extrahera text. Till exempel, hämta all text från varje <p>-element.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Tack för dina kommentarer!
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 4.35
Attribut och Innehåll för Flera Element
Svep för att visa menyn
Alla metoder som behandlades i föregående kapitel kan tillämpas på element med en specifik tagg, det vill säga på resultatet av metoden .find_all(). Eftersom .find_all() returnerar en lista måste du dock komma åt attribut och metoder för varje element separat. Använd en for-loop för detta ändamål. Till exempel, hämta alla attribut för alla <div>-element.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for div in soup.find_all("div"): print(div.attrs)
Samma tillvägagångssätt fungerar för att extrahera text. Till exempel, hämta all text från varje <p>-element.
12345678910111213# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") for p in soup.find_all("p"): print(p.get_text())
Tack för dina kommentarer!