Skip to content

linlucath/Web-Crawling-Practice

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

网页结构

  • 作者

在旧版网页河畔中, 帖子主人的名字相关的 HTML 代码如下:

<a href="https://bbs.uestc.edu.cn/home.php?mod=space&amp;uid=225337" target="_blank" class="xw1">作者名</a>
  • 帖子内容

在旧版网页河畔中, 帖子内容相关的 HTML 代码如下:

<table cellspacing="0" cellpadding="0"><tbody><tr><td class="t_f" id="postmessage_39913894">
帖子内容
</td></tr></tbody></table>

About

爬虫练习, 实现了与数据库连接, 并发

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages