本项目为CSGO饰品汰换组合分析工具,通过多维度数据分析(价格、磨损、品质等),帮助用户计算不同武器箱组合的收益率、成本等关键指标,提供汰换策略建议。包含数据爬取、预处理、多元组合模拟等功能模块。
文件名 | 功能描述 |
---|---|
模拟前预处理.py |
数据清洗、品质映射、武器箱ID编码、合并磨损数据 |
数据预选.py |
根据品质/磨损筛选Excel数据,生成待爬取的物品编号JSON |
价格处理.py |
合并价格数据与皮肤元数据,生成标准化分析表 |
重构二元.py (已弃用) |
|
多元模拟.py |
多元组合分析(支持N个箱子),多线程加速,磨损预测模型,生成分析报告 |
mainexcel.py |
Buff网站数据爬取核心模块,获取实时价格/磨损/贴纸信息 |
文件名 | 功能描述 |
---|---|
mian.py |
主控脚本,协调各模块执行顺序,参数配置入口 |
graph TD
A[数据预选.py] -->|生成物品ID列表| B(mainexcel.py)
B -->|爬取实时数据| C[价格处理.py]
C -->|生成标准价格表| D[模拟前预处理.py]
D -->|清洗后的数据| E[重构二元.py/多元模拟.py]
E -->|分析报告| F[输出Excel/CSV]
- Python 3.8+
- 依赖库:
pandas numpy requests tqdm openpyxl xlsxwriter matplotlib seaborn math
- Cookie配置:在
cookie.txt
中填入有效的Buff网站cookie
- 数据初始化
python 数据预选.py --input 路径/饰品编号.xlsx --skin_lst ['品质1','品质2','磨损等级',[起始页,结束页],StatTrak™=1,0]
- 数据爬取
python mainexcel.py --input csgoItemsInfoFixed1.json --output 输出数据.xlsx
- 多元组合分析(示例:3箱组合)
python 多元模拟.py --input 数据.xlsx --output 分析结果/ --n 3 --threshold 0.8
- 品质优先级映射:违禁(1) > 隐秘(2) > ... > 消费级(7)
- 武器箱ID编码:自动生成唯一标识
- 处理缺失:从历史数据中寻找需要缺失数据,并且优先使用近期的数据
- 加载磨损磨损极值数据
- 数据合并策略:
- 低品质皮肤:保留最低价条目
- 高品质皮肤:按武器箱分组去重
- 磨损计算模型:
wear = (皮肤的最大磨损 - 皮肤的最小磨损) * 权重*炉渣平均磨损 + 皮肤的最小磨损
- 多线程加速:支持20线程并行处理
- 智能过滤:收益率阈值(threshold)动态过滤低效组合
- 缺失数据处理:会从历史数据中寻找需要补充的数据
- 优化策略:升级算法去重复计算项,使用矩阵运算加速
- 可以切换普通/暗金饰品
工作表名称 | 内容描述 |
---|---|
收益率 | 不同比例组合的预期收益率矩阵 |
成本 | 各组合方案的成本对比表 |
磨损预测 | 基于线性模型的磨损值预测 |
炉渣信息 | 副产品皮肤的均价/磨损统计 |
# mian.py 关键参数
skin_lst = ['保密', '受限', "崭新出厂", [0,42],0] # 品质1,品质2,目标磨损,武器箱范围,选择普通饰品还是暗金饰品
n = 3 # 组合箱子数量
threshold = 1.03 # 收益率过滤阈值 算上平台手续费建议设置超过1.03
文件名 | 功能描述 |
---|---|
获取武器箱武器编号.py |
通过过武器箱的一个编号爬取整个武器箱武器编号列表 |
皮肤磨损极值获取.py |
用来获取皮肤磨损极值,用于计算磨损预测模型,用于维护饰品磨损区间.xlsx |
数据整理.py |
用于将获取武器箱武器编号.py获取的武器箱武器编号列表整理成标准格式,用于维护cs饰品编号.xlsx ,便于主程序调用 |
合并数据.py |
用于将获取武器箱武器编号.py获取的武器箱武器编号列表整理成标准格式,用于维护对应编号.xlsx ,便于主程序调用 |
工具使用请参考文件注释,在使用爬虫工具时请遵守网址的规则,请勿频繁爬取。
虽然支持多多个箱子的模拟,但限于个人能力只能优化至4个箱子(仅对作者电脑的上限)用时15分钟,更多数量的箱子模拟作者也未曾尝试,希各位能根据自己的电脑性能量力而行,有能力可以自己更改线程数量来适配自己的电脑。
此脚本产生的数据仅为模拟,并不代表真实的数据,请理性的看待数据,理性消费。
此脚本仅供学习参考,请勿用于非法用途。
此脚本仅供个人使用,请勿用于商业用途。
- 定期更新cookie以保证爬虫功能正常
- 磨损区间数据需维护
饰品磨损区间.xlsx
- 首次运行前执行
pip install -r requirements.txt