|
|
|
@ -23,13 +23,13 @@ pip install selenium
|
|
|
|
|
|
|
|
|
|
### Cookie管理
|
|
|
|
|
|
|
|
|
|
1. **登录和Cookie检索:**
|
|
|
|
|
- **登录和Cookie检索:**
|
|
|
|
|
- 函数`getcookie()`用于通过扫描QR码手动登录京东网站,并在登录后自动保存会话Cookie到文件(`Jdcookie.txt`)。这个过程在初始运行时需要手动操作以进行认证。
|
|
|
|
|
- 脚本等待直到URL变更为京东首页,表示登录成功,然后检索并保存Cookie。
|
|
|
|
|
|
|
|
|
|
### 产品数据抓取
|
|
|
|
|
|
|
|
|
|
2. **数据抓取流程:**
|
|
|
|
|
- **数据抓取流程:**
|
|
|
|
|
- 再次运行脚本时(已保存Cookie),它加载这些Cookie以跳过登录步骤。
|
|
|
|
|
- 脚本遍历京东网站的搜索结果,搜索特定查询("口红")。
|
|
|
|
|
- 它从最多50页中抓取产品标题、价格、店铺名称和评论数等细节。
|
|
|
|
|