You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
1.5 KiB
1.5 KiB
102201601
本项目为软工实践个人编程任务:2024巴黎奥运会视频弹幕分析挖掘
本次作业要求实现2024巴黎奥运会视频弹幕分析,使用爬虫在B站爬取相关视频弹幕,并给出数量排名前8项关于本次赛事应用AI技术的弹幕,同时所有数据进行词云可视化分析,最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。
附加题实现:爬取B站搜索关键词为“孙颖莎”的视频弹幕,对弹幕进行情感分析,了解B站用户对于莎莎的情感态度。
环境配置:requirements.txt
文件说明:
-
基本任务与附加题代码
bullet_comments_crawler.py
bullet_comment_analysis.py
word_cloud.py
emotion_analysis.py
- 运行
main.py main_addtion.py
可得出结果数据与图表
- 运行
-
基本任务结果
2024巴黎奥运会统计弹幕结果.xlsx
2024巴黎奥运会统计弹幕词云图.png
-
附加题结果
孙颖莎弹幕情感分析图.jpg
孙颖莎弹幕词云图.png
-
单元测试代码
test_bullet_comments_crawler.py
test_comment_analysis.py
test_emotion_analysis.py
test_word_cloud.py
终端执行
coverage run -m unittest tests.xxx.py
运行测试代码 执行coverage html
生成覆盖率测试报告 -
单元测试结果.docx
使用flake8
工具对代码进行分析并消除警告
使用cProfile
对数据统计分析部分的代码进行性能测试,并通过snakeviz
工具可视化数据结果