GitHub

智能羽毛球推荐系统

pip install -r requirements.txt 安装相关依赖的库
cd badmintoncn 进入到爬虫目录，
scrapy crwal [爬虫名字] 爬取数据到/DataAnalysis/data/comment_data.csv, /DataAnalysis/data/info_data.csv, /DataAnalysis/data/train_data.csv, 爬虫的名字为comment_spider，train_data_spider，basic_info_spider

----------------- 以上是爬取数据部分，若数据已经存在，则无需运行

-------------------- 以上是训练模型部分，若模型文件已经存在，则无需运行

jupyter notebook 接下来步骤在show.ipyb运行
运行show.ipyb中的所有cell，在这里面会运行生成comment_data_tags.csv,sum_data.csv，其中有个异步多进程产生data.csv的步骤是预测评论，很耗时间大约2-3小时跑完

-------------------- 以上是生成关键数据data.csv和数据可视化的过程，如data.csv已经存在，则无需运行

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
DataAnalysis		DataAnalysis
Model		Model
Web		Web
badmintoncn		badmintoncn
.gitignore		.gitignore
README.md		README.md
__init__.py		__init__.py
requirements.txt		requirements.txt