Toepassen van Stringmethoden
Wat kun je doen met de pagina die je hebt gelezen? Aangezien het een string is, kun je elke stringmethode gebruiken. Bijvoorbeeld, de .find()-methode retourneert de index van het eerste voorkomen van een specifiek element. Je kunt deze methode gebruiken om de paginatitel te lokaliseren door de indexen van de openings- en sluitende tags te vinden en rekening te houden met de lengte van de sluitende tag.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Zoals getoond in het bovenstaande voorbeeld zijn er twee variabelen aangemaakt: start en finish. De variabele start slaat de index op van het eerste teken binnen de openingstag <title>, terwijl de variabele finish de index opslaat van het teken direct na de sluitende tag </title>. De .find()-methode retourneert de startindex van de sluitende tag, dus de lengte van de tag wordt toegevoegd om de uiteindelijke positie te verkrijgen.
Lijst-slicing sluit het laatste element uit, daarom wordt het volgende teken na de sluitende tag gebruikt.
Bedankt voor je feedback!
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 4.35
Toepassen van Stringmethoden
Veeg om het menu te tonen
Wat kun je doen met de pagina die je hebt gelezen? Aangezien het een string is, kun je elke stringmethode gebruiken. Bijvoorbeeld, de .find()-methode retourneert de index van het eerste voorkomen van een specifiek element. Je kunt deze methode gebruiken om de paginatitel te lokaliseren door de indexen van de openings- en sluitende tags te vinden en rekening te houden met de lengte van de sluitende tag.
1234567891011121314# Importing the module from urllib.request import urlopen # Opening web page url = "https://codefinity-content-media.s3.eu-west-1.amazonaws.com/18a4e428-1a0f-44c2-a8ad-244cd9c7985e/mother.html" page = urlopen(url) # Reading and decoding web_page = page.read().decode("utf-8") # Indexes of opening and closing title tags start = web_page.find("<title") finish = web_page.find("</title>") + len("</title>") print(web_page[start:finish])
Zoals getoond in het bovenstaande voorbeeld zijn er twee variabelen aangemaakt: start en finish. De variabele start slaat de index op van het eerste teken binnen de openingstag <title>, terwijl de variabele finish de index opslaat van het teken direct na de sluitende tag </title>. De .find()-methode retourneert de startindex van de sluitende tag, dus de lengte van de tag wordt toegevoegd om de uiteindelijke positie te verkrijgen.
Lijst-slicing sluit het laatste element uit, daarom wordt het volgende teken na de sluitende tag gebruikt.
Bedankt voor je feedback!