diff --git a/README.md b/README.md index f00218d..1a668a6 100644 --- a/README.md +++ b/README.md @@ -28,7 +28,7 @@ - **数据抓取流程:** - 再次运行脚本时(已保存Cookie),它加载这些Cookie以跳过登录步骤。 - 脚本遍历京东网站的搜索结果,搜索特定的查询("口红")。 - - 它从最多50页中抓取产品标题、价格、店铺名称和评论数等细节。 + - 它从最多50页中抓取产品标题、价格、店铺名称和评论数等要素。 - 抓取的数据存储在`JD.csv`中。 ### 详细分解 @@ -89,11 +89,11 @@ if __name__ == '__main__': csv.writer(file).writerow(['商品', '价格', '店铺', '评论数']) for page in range(0, 50): - sleep(5) + sleep(10) # 下滑页面 js_down = "window.scrollTo(0, 8000)" driver.execute_script(js_down) - sleep(5) + sleep(10) goods = driver.find_elements(By.CLASS_NAME, 'gl-i-wrap') for good in goods: title = good.find_element(By.CSS_SELECTOR, '.p-name em').text.strip()