You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
2 years ago | |
|---|---|---|
| readme.md | 2 years ago | |
readme.md
项目的主要目录
├─all
│ ├─report
│ ├─resource
│ │ ├─cloud
│ │ ├─db
│ │ ├─img
│ │ ├─mp3
│ │ └─word
│ └─template
│ ├─cloud
│ ├─default
│ ├─driver
│ └─html
└─onePart
├─part_id
├─part_message
├─part_mp3
│ ├─chromedriver-linux64
│ ├─chromedriver-win64
│ └─Music
└─part_word
onePart
onePart文件夹存放了各个部分的代码
all
all文件夹是整个项目的核心文件夹,其中report文件夹存放了报告文件,resource文件夹存放了资源文件,template文件夹运行爬虫需要的文件
all/spider.py
all/spider.py是爬虫的代码
all/api.py
all/api.py是web后端接口的代码,运行在5500端口
all/report.py
all/report.py存放了生成报告的代码
all/template
all/template文件夹存放了爬虫和后端需要的文件
注意
代码放在压缩包里提交了
因为爬虫用到了selemium,所以需要安装chrome 115以上版本
上传的代码需要先运行爬虫,后端才有数据可以用!
cd ./all && python spider.py