Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Verkkosivujen Tietojen Keruun Perusteet | Getting Acquainted with HTML
Web Scraping Pythonilla

bookVerkkosivujen Tietojen Keruun Perusteet

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.

Note
Määritelmä

Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:

  • selenium mahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;
  • lxml helpottaa sekä HTML- että XML-tiedostojen käsittelyä.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 4.35

bookVerkkosivujen Tietojen Keruun Perusteet

Pyyhkäise näyttääksesi valikon

Prerequisites
Edellytykset

Tervetuloa kurssille! Tänään alat tutustua siihen, miten web scraping toimii.

Note
Määritelmä

Web scraping on prosessi, jossa tietoa kerätään automaattisesti verkkosivuilta. Esimerkiksi sitä voidaan käyttää hintojen vertailuun eri alustoilla tai osaketietojen keräämiseen.

Pythonissa on lukuisia menetelmiä datan poimimiseen. Verrataan suosituimpia web-scraping-kirjastoja: requests, BeautifulSoup, lxml ja Selenium.

Tämän kurssin pääpaino on kahdessa ensimmäisessä kirjastossa. Kuitenkin myös selenium ja lxml ovat tehokkaita työkaluja:

  • selenium mahdollistaa JavaScript-tuen, mikä mahdollistaa vuorovaikutuksen dynaamisten kenttien ja valikoiden kanssa;
  • lxml helpottaa sekä HTML- että XML-tiedostojen käsittelyä.
question mark

Valitse oikea väittämä.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 1. Luku 1
some-alt