抖音，小红书内容互动数据获取

由于平台的限制，自己发布的视频/笔记的互动数据，无法通过API接口获取，为了实现对内容效果的有效追踪，我通过一些简单的爬虫来对数据进行下载，清洗，导入，最终可以看到发布的内容的互动数据每天的增长情况。

作用

自动抓取抖音，小红书创作者中心里的每条视频的播放，完播，点击，2s跳出，播放时长，点赞，分享，评论，收藏，主页访问，粉丝增量等数据

基础设置

在project_config文件夹的project.py中，设置好对应的路径，通常用默认的就可以。

获取缓存文件（pkl文件）

如果已经有了，请直接复制到pkl文件夹中，命名方式
- 抖音：douyin + _ + 其他任意字符（最好是账号名），如douyin_123456.pkl
- 小红书：xhs + _ + 其他任意字符（最好是账号名）, 如xhs_123456.pkl
如果没有pkl文件，直接运行main.py, 第一次需要扫码登录，登陆后回到代码界面输入回车，即可继续。然后把pkl文件剪切到pkl文件夹

用法

安装requirements.txt

pip install requirements.txt

直接运行main.py即可

如果只是仅仅对抓取抖音和小红书后台内容有兴趣，直接运行spiders文件夹下的douyin.py或xhs.py即可。

数据处理部分，在data_processing文件夹中

可以先从后台下载对应的excel文件，清空标题以外的内容，命名为yesterday.xlsx
系统会自动下载data.xlsx,并在处理完后，自动将data.xlsx命名为yesterday.xlsx

Name		Name	Last commit message	Last commit date
Latest commit History 36 Commits
data_processing		data_processing
project_config		project_config
spiders		spiders
utils		utils
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
main.py		main.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

抖音，小红书内容互动数据获取

作用

基础设置

获取缓存文件（pkl文件）

用法

安装requirements.txt

直接运行main.py即可

数据处理部分，在data_processing文件夹中

有不明白的可以加群聊，大家多互动

About

Uh oh!

Releases

Packages

Languages

License

cwjcw/xhs_douyin_content

Folders and files

Latest commit

History

Repository files navigation

抖音，小红书内容互动数据获取

作用

基础设置

获取缓存文件（pkl文件）

用法

安装requirements.txt

直接运行main.py即可

数据处理部分，在data_processing文件夹中

有不明白的可以加群聊，大家多互动

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages