Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Anwenden von String-Methoden | Einführung in HTML
Web Scraping Mit Python

bookAnwenden von String-Methoden

Was können Sie mit der gelesenen Seite tun? Da es sich um einen String handelt, können Sie jede String-Methode verwenden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Sie können sie verwenden, um den Seitentitel zu lokalisieren, indem Sie die Indizes der öffnenden und schließenden Tags finden und die Länge des schließenden Tags berücksichtigen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu erhalten.

Note
Mehr erfahren

Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Can you explain how the .find() method works in more detail?

What other string methods can I use to process the web page content?

Can you show how to extract just the text inside the <title> tags?

Awesome!

Completion rate improved to 4.35

bookAnwenden von String-Methoden

Swipe um das Menü anzuzeigen

Was können Sie mit der gelesenen Seite tun? Da es sich um einen String handelt, können Sie jede String-Methode verwenden. Zum Beispiel gibt die Methode .find() den Index des ersten Vorkommens eines bestimmten Elements zurück. Sie können sie verwenden, um den Seitentitel zu lokalisieren, indem Sie die Indizes der öffnenden und schließenden Tags finden und die Länge des schließenden Tags berücksichtigen.

1234567891011121314
# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
copy

Wie im obigen Beispiel gezeigt, wurden zwei Variablen, start und finish, erstellt. Die Variable start speichert den Index des ersten Zeichens innerhalb des öffnenden <title>-Tags, während die Variable finish den Index des Zeichens direkt nach dem schließenden </title>-Tag speichert. Die Methode .find() gibt den Startindex des schließenden Tags zurück, daher wird die Länge des Tags hinzugefügt, um die Endposition zu erhalten.

Note
Mehr erfahren

Listenslicing schließt das letzte Element aus, weshalb das nächste Zeichen nach dem schließenden Tag verwendet wird.

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 1. Kapitel 10
some-alt