|
|
|
@ -1,2 +1,54 @@
|
|
|
|
|
# 102201601
|
|
|
|
|
# 102201601
|
|
|
|
|
|
|
|
|
|
**本项目为软工实践个人编程任务:2024巴黎奥运会视频弹幕分析挖掘**
|
|
|
|
|
|
|
|
|
|
本次作业要求实现2024巴黎奥运会视频弹幕分析,使用爬虫在B站爬取相关视频弹幕,并给出数量排名前8项关于本次赛事应用AI技术的弹幕,同时所有数据进行词云可视化分析,最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。
|
|
|
|
|
|
|
|
|
|
附加题实现:爬取B站搜索关键词为“孙颖莎”的视频弹幕,对弹幕进行情感分析,了解B站用户对于莎莎的情感态度。
|
|
|
|
|
|
|
|
|
|
**环境配置:**`requirements.txt`
|
|
|
|
|
|
|
|
|
|
**文件说明:**
|
|
|
|
|
|
|
|
|
|
- 基本任务与附加题代码
|
|
|
|
|
|
|
|
|
|
bullet_comments_crawler.py
|
|
|
|
|
|
|
|
|
|
bullet_comment_analysis.py
|
|
|
|
|
|
|
|
|
|
word_cloud.py
|
|
|
|
|
|
|
|
|
|
emotion_analysis.py
|
|
|
|
|
|
|
|
|
|
- 运行 `main.py main_addtion.py`可得出结果数据与图表
|
|
|
|
|
|
|
|
|
|
- 基本任务结果
|
|
|
|
|
|
|
|
|
|
2024巴黎奥运会统计弹幕结果.xlsx
|
|
|
|
|
|
|
|
|
|
2024巴黎奥运会统计弹幕词云图.png
|
|
|
|
|
|
|
|
|
|
- 附加题结果
|
|
|
|
|
|
|
|
|
|
孙颖莎弹幕情感分析图.jpg
|
|
|
|
|
|
|
|
|
|
孙颖莎弹幕词云图.png
|
|
|
|
|
|
|
|
|
|
- 单元测试代码
|
|
|
|
|
|
|
|
|
|
test_bullet_comments_crawler.py
|
|
|
|
|
|
|
|
|
|
test_comment_analysis.py
|
|
|
|
|
|
|
|
|
|
test_emotion_analysis.py
|
|
|
|
|
|
|
|
|
|
test_word_cloud.py
|
|
|
|
|
|
|
|
|
|
终端执行`coverage run -m unittest tests.xxx.py` 运行测试代码 执行 `coverage html`生成覆盖率测试报告
|
|
|
|
|
|
|
|
|
|
- 单元测试结果.docx
|
|
|
|
|
|
|
|
|
|
使用`flake8`工具对代码进行分析并消除警告
|
|
|
|
|
|
|
|
|
|
使用`cProfile`对数据统计分析部分的代码进行性能测试,并通过`snakeviz`工具可视化数据结果
|
|
|
|
|