diff --git a/.gitignore b/.gitignore index 32fde51..a5cfbd6 100644 --- a/.gitignore +++ b/.gitignore @@ -78,3 +78,8 @@ fabric.properties .idea/caches/build_file_checksums.ser /.idea +/.vs +__pycache__ +__pycache__ +/*.xlsx +/*.csv diff --git a/README.md b/README.md index dc82be9..ddb9186 100644 --- a/README.md +++ b/README.md @@ -1,2 +1,21 @@ # Spyder_python +本项目采用多线程爬虫技术,实现了对b站热门排行榜的播放数据爬取与分析,其主要功能包括:对b站排行榜的爬取与分析,数据整理,报表显示,报表输出为csv和excel,分析报告生成,特点是多线程、用户友好、良好git管理、拥有以pytest规范构建的单元测试。 + +随着互联网技术的飞速发展和普及,网络视频平台如bilibili(简称B站)已经成为大众获取信息、娱乐休闲的重要途径。B站以其独特的弹幕文化和丰富的视频资源吸引了大量年轻用户,形成了一个极具活力的社区。在这个背景下,对B站数据的爬取和分析变得尤为重要。 + +B站的热门榜数据具有极高的研究价值和应用前景。视频的播放量、点赞量、评论数等数据可以反映视频的热度和受欢迎程度,对于视频创作者和平台运营者来说,这些数据是优化内容、提升用户体验的重要依据。 + +开发一个针对B站的爬虫项目,实现对B站数据的自动化抓取和分析,对于学术研究、商业分析还是个人兴趣探索都具有重要意义。 + + + +![](assets/2024-04-26-10-47-09-image.png) + +
良好的git分支管理
+ +![](assets/2024-04-26-10-50-50-image.png) + +
项目结构展示
+ + diff --git a/assets/2024-04-26-10-47-09-image.png b/assets/2024-04-26-10-47-09-image.png new file mode 100644 index 0000000..cc38081 Binary files /dev/null and b/assets/2024-04-26-10-47-09-image.png differ diff --git a/assets/2024-04-26-10-50-50-image.png b/assets/2024-04-26-10-50-50-image.png new file mode 100644 index 0000000..331cbcb Binary files /dev/null and b/assets/2024-04-26-10-50-50-image.png differ diff --git a/requirements.txt b/requirements.txt new file mode 100644 index 0000000..eae95f8 --- /dev/null +++ b/requirements.txt @@ -0,0 +1,3 @@ +lxml==5.2.0 +pytest==8.1.1 +Requests==2.31.0