- Utilizando operadores especiais de busca em qualquer buscador comum utilizados pela internet, você encontrará um resultado de pesquisa onde todos os links possuem arquivos com a extensão indicada com os assuntos solicitados pelo usuário na string de busca, algumas pessoas utilizam destes métodos para criar bases de dados para diversos fins, muitos destes fins são relacionados a pesquisa, visto isso foi desenvolvido um protótico para este fim (criação de uma base de dados), além de poder contribuir com pessoas que estejam precisando de algo parecido, estou realizando esse desenvolvimento para fins educacionais/hobby, o mesmo ainda necessita de mais implementações para se tornar ainda mais eficiente.
- Passo 1: Realização da pesquisa utilizando os operadores de busca.
- Passo 2: Inserção da url/urls na lista que será percorrida.
- Passo 3: Insersão do path da pasta a qual armazenará os arquivos.
- Passo 3: Preparar um cafezinho, café é bom em qualquer momento.
- Mais opções de extensões. Até o momento está realizando a extração de arquivos com extensão (PDF).
- Uma interface amigável, pois até o momento é apenas realizando a execução do código via editor de texto ou IDE.
- Exemplo: "gov" filetype: pdf
- Retorna arquivos com extensão PDF relacionados ao governo. Se for mais especifico podes selecionar uma pade de uma determinada organização ou assunto. Pra que? Pode ser até pelo mesmo motivo ao qual eu desenvolvi esse extrator.
- Motivo: Só pra ver se dava certo mesmo.
- Créditos && Fonte Kinsta: https://kinsta.com/pt/blog/operadores-de-busca-do-google/
- python
- os
- beautifulsoup
É óbvio que ainda faltam diversas melhorias (risos), mas justamente por isso criei este repositório, além de divulgar um pouco do que faço, estou aberto a ajuda, criticas e orientações. Ademais, se chegou até este trecho do texto, meu muito obrigado.
- "O começo, é apenas o início."
- by Kim Lima.