Anwenden von String-Methoden
Was können Sie mit der gelesenen Seite tun? Da es sich um einen String handelt, können Sie jede String-Methode verwenden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Sie können sie verwenden, um den Seitentitel zu lokalisieren, indem Sie die Indizes der öffnenden und schließenden Tags finden und die Länge des schließenden Tags berücksichtigen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu erhalten.
Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Can you explain how the .find() method works in more detail?
What other string methods can I use to process the web page content?
Can you show how to extract just the text inside the <title> tags?
Awesome!
Completion rate improved to 4.35
Anwenden von String-Methoden
Swipe um das Menü anzuzeigen
Was können Sie mit der gelesenen Seite tun? Da es sich um einen String handelt, können Sie jede String-Methode verwenden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Sie können sie verwenden, um den Seitentitel zu lokalisieren, indem Sie die Indizes der öffnenden und schließenden Tags finden und die Länge des schließenden Tags berücksichtigen.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu erhalten.
Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.
Danke für Ihr Feedback!