Impara Navigazione del Documento HTML | Decodifica HTML con Beautiful Soup

Scorri per mostrare il menu

Dopo aver letto il documento HTML, è possibile navigarlo in diversi modi. Per esplorarlo ulteriormente, specificare un tag come attributo. Ad esempio, esaminare l'elemento <head> e visualizzarlo in un formato strutturato utilizzando il metodo .prettify().


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

È possibile sperimentare sostituendo, ad esempio, l'attributo .head con .body. Come mostrato sopra, l'elemento <head> include diversi figli. È possibile iterare su tutti i figli degli elementi utilizzando un ciclo for e l'attributo .children.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 2. Capitolo 2

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Sezione 2. Capitolo 2