Skip to content

爬取百度搜索首页上的广告信息。从芝麻HTTP代理获取代理ip,以便爬取在不同城市的搜索广告,关键词可以任意设置。可以设置定时抓取并将原始html文件存在本地。解析结果可以以各种形式如csv输出. pom.xml工程

License

Notifications You must be signed in to change notification settings

xu-ben/BaiduADCrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

75 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

如果需要使用芝麻代理,需要在config.properties里加上appKey、neek和pack的值

About

爬取百度搜索首页上的广告信息。从芝麻HTTP代理获取代理ip,以便爬取在不同城市的搜索广告,关键词可以任意设置。可以设置定时抓取并将原始html文件存在本地。解析结果可以以各种形式如csv输出. pom.xml工程

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages