Add a README for JD spider part

master
Fishermanykx 3 years ago
parent 27c25e8ceb
commit 18a8de2334

@ -0,0 +1,9 @@
使用 python 的 `selenium` 库,分配件类型进行爬取
运行此代码时,需要注意:
- 请预先安装好 `selenium` 库,`chromedriver` 调试工具,以及 `Python 3` 开发环境
- **请保证在较好的网络环境下运行**推荐在晚上12:00之后早上6:00之前运行否则可能出现评论缺失的情况
- 若爬取到的某条数据的评论数为 `100`,好评率为 `90%`,则爬虫爬取该配件的评论失败。可能是爬取时由于网络不通畅而加载不出评论区,也有可能是因为该配件没有评论(处于预约状态或真的没人评论)
- 请不要在同一个ip下同时运行大于等于3个爬虫否则会因为访问太过频繁而导致出现需要输入验证码的情况
Loading…
Cancel
Save