Lære Navigere i HTML-dokument | Dekoding HTML med Beautiful Soup

Sveip for å vise menyen

Etter å ha lest HTML-dokumentet, kan du navigere det på ulike måter. For å utforske det videre, spesifiser en tag som et attributt. For eksempel kan du undersøke <head>-elementet og vise det i et strukturert format ved å bruke .prettify()-metoden.


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

Du kan gjerne eksperimentere ved å bytte ut .head-attributtet med for eksempel .body. Som vist ovenfor, omfatter <head>-elementet flere underordnede elementer. Du kan iterere gjennom alle underordnede elementer ved å bruke en for-løkke og .children-attributtet.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

Alt var klart?

Takk for tilbakemeldingene dine!

Seksjon 2. Kapittel 2

Spør AI

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Seksjon 2. Kapittel 2