Skip to content
This repository was archived by the owner on Nov 12, 2024. It is now read-only.

zll-hust/BaiduWenKu-crawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

爬取百度文库

Before use:

执行setup.bat

Requirements

  • Python 3 环境
  • 将文件夹放置在一个路径文件夹名中没有空格的位置

使用说明

用户界面:

1

输入要爬取的百度文库网页的url地址:

2

如果没有设置环境变量,需要手动输入本地python.exe文件的绝对路径,如果已经设置环境变量,不需要修改该部分:

3

如果输入了错误的网址或python路径,会弹窗报错:

4

选择是否爬取文本内容:

5

爬取成功后会有文字提示,爬出结果保存在文件夹内:

6

联系作者

本项目由xkw和zll共同完成,如有疑惑请咨询:

xkw:xiasen99@gmail.com

zll:zh20010728@126.com https://github.com/zll-hust

About

HUST管理学院2020年计算机程序设计大作业

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published