Introduction au Web Scraping
Bienvenue dans le cours ! Aujourd'hui, vous allez commencer à explorer le fonctionnement du web scraping.
Web scraping désigne un procédé permettant d’extraire automatiquement des informations à partir de sites web. Par exemple, il est possible de l’utiliser pour comparer les prix sur différentes plateformes ou collecter des données sur les actions.
Il existe de nombreuses méthodes en Python pour extraire des données. Comparaison des bibliothèques les plus populaires pour le web scraping : requests, BeautifulSoup, lxml et Selenium.
Tout au long de ce cours, l'accent principal sera mis sur les deux premières bibliothèques. Cependant, selenium et lxml sont également des outils puissants :
seleniumpermet la prise en charge de JavaScript, facilitant l'interaction avec des champs et menus dynamiques ;lxmlsimplifie le travail avec les fichiers HTML et XML.
Merci pour vos commentaires !
Demandez à l'IA
Demandez à l'IA
Posez n'importe quelle question ou essayez l'une des questions suggérées pour commencer notre discussion
Awesome!
Completion rate improved to 4.35
Introduction au Web Scraping
Glissez pour afficher le menu
Bienvenue dans le cours ! Aujourd'hui, vous allez commencer à explorer le fonctionnement du web scraping.
Web scraping désigne un procédé permettant d’extraire automatiquement des informations à partir de sites web. Par exemple, il est possible de l’utiliser pour comparer les prix sur différentes plateformes ou collecter des données sur les actions.
Il existe de nombreuses méthodes en Python pour extraire des données. Comparaison des bibliothèques les plus populaires pour le web scraping : requests, BeautifulSoup, lxml et Selenium.
Tout au long de ce cours, l'accent principal sera mis sur les deux premières bibliothèques. Cependant, selenium et lxml sont également des outils puissants :
seleniumpermet la prise en charge de JavaScript, facilitant l'interaction avec des champs et menus dynamiques ;lxmlsimplifie le travail avec les fichiers HTML et XML.
Merci pour vos commentaires !