Skip to content

flucasbauer/webscraping_pdfs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Web Scraping para Download de +1000 PDFs

Desenvolvi um script de web scraping com o objetivo de criar um banco de dados para apoiar o Núcleo de pesquisa no qual atuo. O projeto envolveu a parametrização de diversos campos e a automação de CAPTCHAs, integrando-se a um pipeline de ETL.

Utilizei a biblioteca Selenium e a técnica 2captcha, amplamente empregada para resolver CAPTCHAs. O código foi projetado para lidar com CAPTCHAs incorretos, repetindo a chamada à API 2captcha até que o desafio seja resolvido com sucesso, garantindo o download automático dos PDFs antes de prosseguir.

execucao_script.mp4

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published