Update README.md

master
p2uavm3kl 2 years ago
parent f6ca9ee64c
commit 25967dac58

@ -1,5 +1,6 @@
# 项目概述 # 项目概述
本项目基于selenium+scrapy-redis框架爬取bilibili网站的数据通过研究网站使用的反爬虫技术使用Selenium驱动浏览器模拟真人使用浏览器在浏览器中加入cookie绕过登录并使用代理ip爬取的数据使用mysql数据库进行存储并对爬取的数据进行数据分析和可视化展示。 本项目基于selenium+scrapy-redis框架爬取bilibili网站的数据通过研究网站使用的反爬虫技术使用Selenium驱动浏览器模拟真人使用浏览器在浏览器中加入cookie绕过登录并使用代理ip爬取的数据使用mysql数据库进行存储并对爬取的数据进行数据分析和可视化展示。
主要功能包括爬取了bilibili网站的番剧信息和包括番剧在内的所有视频的信息包括播放量、收藏量和评论量等。并筛选出相对优秀的视频数据进行可视化的展示。最后通过展示出的图表进行分析。 主要功能包括爬取了bilibili网站的番剧信息和包括番剧在内的所有视频的信息包括播放量、收藏量和评论量等。并筛选出相对优秀的视频数据进行可视化的展示。最后通过展示出的图表进行分析。
关键字seleniumscrapy-rediscookie代理ip数据可视化mysql数据库 关键字seleniumscrapy-rediscookie代理ip数据可视化mysql数据库

Loading…
Cancel
Save