Mon verdict : le classique du scraping Python, avec ses limites.
BeautifulSoup est la librairie de reference pour parser du HTML en Python. Vous recuperez le HTML avec requests, vous le passez a BeautifulSoup, et vous extrayez ce que vous voulez. Pour les pages statiques, ca fait le job.
Ce qui me plait moins : ca ne gere pas le JavaScript - et aujourd'hui, la majorite des sites chargent du contenu dynamiquement. Vous devez combiner avec Selenium/Playwright, ce qui alourdit le setup. Pour du scraping a grande echelle, Scrapy est plus adapte.
Mon conseil : bon point d'entree pour apprendre le scraping en Python, mais vous atteindrez vite ses limites sur des projets reels. Prevoyez de monter en competence vers Scrapy ou les Actors Apify.