Verkkosivujen Tietojen Keruun Perusteet
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 4.35
Verkkosivujen Tietojen Keruun Perusteet
Pyyhkäise näyttääksesi valikon
Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.
Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.
Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.
Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:
seleniummahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;lxmlhelpottaa sekä HTML- että XML-tiedostojen käsittelyä.
Kiitos palautteestasi!