Navigieren im HTML-Dokument
Nach dem Einlesen des HTML-Dokuments kann dieses auf verschiedene Arten navigiert werden. Um es weiter zu untersuchen, kann ein Tag als Attribut angegeben werden. Beispielsweise kann das <head>-Element betrachtet und mit der Methode .prettify() in einem strukturierten Format ausgegeben werden.
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Es kann beispielsweise auch das Attribut .head durch .body ersetzt werden. Wie oben gezeigt, umfasst das <head>-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for-Schleife und dem Attribut .children durchlaufen werden.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 4.35
Navigieren im HTML-Dokument
Swipe um das Menü anzuzeigen
Nach dem Einlesen des HTML-Dokuments kann dieses auf verschiedene Arten navigiert werden. Um es weiter zu untersuchen, kann ein Tag als Attribut angegeben werden. Beispielsweise kann das <head>-Element betrachtet und mit der Methode .prettify() in einem strukturierten Format ausgegeben werden.
123456789101112# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") print(soup.head.prettify())
Es kann beispielsweise auch das Attribut .head durch .body ersetzt werden. Wie oben gezeigt, umfasst das <head>-Element mehrere Kindelemente. Alle Kindelemente eines Elements können mit einer for-Schleife und dem Attribut .children durchlaufen werden.
1234567891011121314# Importing libraries from bs4 import BeautifulSoup from urllib.request import urlopen # Reading web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/jesus.html" page = urlopen(url) html = page.read().decode("utf-8") # Reading HTML with BeautifulSoup soup = BeautifulSoup(html, "html.parser") # Iterating over all element children for child in soup.head.children: print(child)
Danke für Ihr Feedback!