Summary
This chapter demonstrates how to use Python libraries for making HTTP requests and parsing HTML documents, as well as how to handle dynamic content via browser automation.

General domain of usage
Web scraping

Bienvenue dans le cours ! Aujourd'hui, vous allez commencer à explorer le fonctionnement du **web scraping**.


**Web Scraping** est un procédé utilisé pour extraire automatiquement des informations à partir de sites web. Par exemple, il permet de comparer les prix sur différentes plateformes ou de collecter des données sur les actions.

Définition

Il existe de nombreuses méthodes en Python pour extraire des données. Comparons les bibliothèques les plus populaires pour le web scraping : `requests`, `BeautifulSoup`, `lxml` et `Selenium`.

Tout au long de ce cours, l'accent principal sera mis sur les deux premières bibliothèques. Cependant, `selenium` et `lxml` sont également des outils puissants :

* `selenium` permet la prise en charge de **JavaScript**, autorisant l'interaction avec des champs et menus dynamiques ;
* `lxml` simplifie le travail avec les fichiers **HTML** et **XML**.


Apprenez à extraire automatiquement des données précieuses à partir de sites web. Maîtrisez des techniques pour collecter efficacement des informations, permettant d’effectuer des analyses approfondies, de prendre des décisions fondées sur les données et de découvrir de nouveaux aperçus à partir de l’immense volume d’informations en ligne.

Explorer la structure d’un fichier HTML, apprendre à le charger efficacement et acquérir des compétences pratiques dans la manipulation des données qu’il contient.

Découvrez les principes fondamentaux de Beautiful Soup pour extraire des données à partir de documents HTML. Apprenez à naviguer dans la structure du HTML, à accéder à des éléments spécifiques et à manipuler leurs éléments enfants afin de consolider les bases du web scraping.

Maîtrise de la gestion des attributs d’élément et du contenu avec Beautiful Soup. Acquisition des compétences pour extraire des informations spécifiques, rechercher des éléments par valeurs d’attributs et utiliser des techniques avancées pour analyser et parser efficacement des données HTML.

Introduction au Web Scraping