Lernen Anwenden von String-Methoden

Swipe um das Menü anzuzeigen

Was lässt sich mit der eingelesenen Seite machen? Da es sich um einen String handelt, können beliebige String-Methoden verwendet werden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Damit lässt sich der Seitentitel auffinden, indem die Indizes der öffnenden und schließenden Tags ermittelt und die Länge des schließenden Tags berücksichtigt wird.


              1234567891011121314
            
# Importing the module
from urllib.request import urlopen

# Opening web page
url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html"
page = urlopen(url)

# Reading and decoding
web_page = page.read().decode("utf-8")

# Indexes of opening and closing title tags
start = web_page.find("<title")
finish = web_page.find("</title>") + len("</title>")
print(web_page[start:finish])

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu bestimmen.

Mehr erfahren

Beim Listenslicing wird das letzte Element ausgeschlossen, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.

War alles klar?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10

Fragen Sie AI

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Abschnitt 1. Kapitel 10