You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

53 lines
1.5 KiB

This file contains invisible Unicode characters!

This file contains invisible Unicode characters that may be processed differently from what appears below. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to reveal hidden characters.

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# 102201601
**本项目为软工实践个人编程任务2024巴黎奥运会视频弹幕分析挖掘**
本次作业要求实现2024巴黎奥运会视频弹幕分析使用爬虫在B站爬取相关视频弹幕并给出数量排名前8项关于本次赛事应用AI技术的弹幕同时所有数据进行词云可视化分析最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。
附加题实现爬取B站搜索关键词为“孙颖莎”的视频弹幕对弹幕进行情感分析了解B站用户对于莎莎的情感态度。
**环境配置:**`requirements.txt`
**文件说明:**
- 基本任务与附加题代码
bullet_comments_crawler.py
bullet_comment_analysis.py
word_cloud.py
emotion_analysis.py
- 运行 `main.py main_addtion.py`可得出结果数据与图表
- 基本任务结果
2024巴黎奥运会统计弹幕结果.xlsx
2024巴黎奥运会统计弹幕词云图.png
- 附加题结果
孙颖莎弹幕情感分析图.jpg
孙颖莎弹幕词云图.png
- 单元测试代码
test_bullet_comments_crawler.py
test_comment_analysis.py
test_emotion_analysis.py
test_word_cloud.py
终端执行`coverage run -m unittest tests.xxx.py` 运行测试代码 执行 `coverage html`生成覆盖率测试报告
- 单元测试结果.docx
使用`flake8`工具对代码进行分析并消除警告
使用`cProfile`对数据统计分析部分的代码进行性能测试,并通过`snakeviz`工具可视化数据结果