Aprende Navegación por el Documento HTML | Decodificación de HTML con Beautiful Soup

Desliza para mostrar el menú

Después de leer el documento HTML, puedes navegarlo de diferentes maneras. Para explorarlo más a fondo, especifica una etiqueta como un atributo. Por ejemplo, examina el elemento <head> y muéstralo en un formato estructurado utilizando el método .prettify().


              123456789101112
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
print(soup.head.prettify())

Puedes experimentar sustituyendo el atributo .head por .body, por ejemplo. Como se muestra arriba, el elemento <head> abarca varios elementos secundarios. Puedes iterar a través de todos los hijos de los elementos utilizando un bucle for y el atributo .children.


              1234567891011121314
            
# Importing libraries
from bs4 import BeautifulSoup
from urllib.request import urlopen

# Reading web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html"
page = urlopen(url)
html = page.read().decode("utf-8")

# Reading HTML with BeautifulSoup
soup = BeautifulSoup(html, "html.parser")
# Iterating over all element children
for child in soup.head.children:
  print(child)

¿Todo estuvo claro?

¡Gracias por tus comentarios!

Sección 2. Capítulo 2

Pregunte a AI

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

Sección 2. Capítulo 2