Update README.md

main
php6n4ras 10 months ago
parent 7526005be8
commit ee96986a19

@ -28,7 +28,7 @@
- **数据抓取流程:**
- 再次运行脚本时已保存Cookie它加载这些Cookie以跳过登录步骤。
- 脚本遍历京东网站的搜索结果,搜索特定的查询("口红")。
- 它从最多50页中抓取产品标题、价格、店铺名称和评论数等细节
- 它从最多50页中抓取产品标题、价格、店铺名称和评论数等要素
- 抓取的数据存储在`JD.csv`中。
### 详细分解
@ -89,11 +89,11 @@ if __name__ == '__main__':
csv.writer(file).writerow(['商品', '价格', '店铺', '评论数'])
for page in range(0, 50):
sleep(5)
sleep(10)
# 下滑页面
js_down = "window.scrollTo(0, 8000)"
driver.execute_script(js_down)
sleep(5)
sleep(10)
goods = driver.find_elements(By.CLASS_NAME, 'gl-i-wrap')
for good in goods:
title = good.find_element(By.CSS_SELECTOR, '.p-name em').text.strip()

Loading…
Cancel
Save