diff --git a/README.md b/README.md index e42cf86..6d1b1b1 100644 --- a/README.md +++ b/README.md @@ -1,2 +1,54 @@ # 102201601 +# 102201601 + +**本项目为软工实践个人编程任务:2024巴黎奥运会视频弹幕分析挖掘** + +本次作业要求实现2024巴黎奥运会视频弹幕分析,使用爬虫在B站爬取相关视频弹幕,并给出数量排名前8项关于本次赛事应用AI技术的弹幕,同时所有数据进行词云可视化分析,最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。 + +附加题实现:爬取B站搜索关键词为“孙颖莎”的视频弹幕,对弹幕进行情感分析,了解B站用户对于莎莎的情感态度。 + +**环境配置:**`requirements.txt` + +**文件说明:** + +- 基本任务与附加题代码 + + bullet_comments_crawler.py + + bullet_comment_analysis.py + + word_cloud.py + + emotion_analysis.py + + - 运行 `main.py main_addtion.py`可得出结果数据与图表 + +- 基本任务结果 + +​ 2024巴黎奥运会统计弹幕结果.xlsx + +​ 2024巴黎奥运会统计弹幕词云图.png + +- 附加题结果 + + 孙颖莎弹幕情感分析图.jpg + + 孙颖莎弹幕词云图.png + +- 单元测试代码 + + test_bullet_comments_crawler.py + + test_comment_analysis.py + + test_emotion_analysis.py + + test_word_cloud.py + + 终端执行`coverage run -m unittest tests.xxx.py` 运行测试代码 执行 `coverage html`生成覆盖率测试报告 + +- 单元测试结果.docx + +使用`flake8`工具对代码进行分析并消除警告 +使用`cProfile`对数据统计分析部分的代码进行性能测试,并通过`snakeviz`工具可视化数据结果