You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1.5 KiB

102201601

本项目为软工实践个人编程任务2024巴黎奥运会视频弹幕分析挖掘

本次作业要求实现2024巴黎奥运会视频弹幕分析使用爬虫在B站爬取相关视频弹幕并给出数量排名前8项关于本次赛事应用AI技术的弹幕同时所有数据进行词云可视化分析最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。

附加题实现爬取B站搜索关键词为“孙颖莎”的视频弹幕对弹幕进行情感分析了解B站用户对于莎莎的情感态度。

环境配置:requirements.txt

文件说明:

  • 基本任务与附加题代码

    bullet_comments_crawler.py

    bullet_comment_analysis.py

    word_cloud.py

    emotion_analysis.py

    • 运行 main.py main_addtion.py可得出结果数据与图表
  • 基本任务结果

2024巴黎奥运会统计弹幕结果.xlsx

2024巴黎奥运会统计弹幕词云图.png

  • 附加题结果

    孙颖莎弹幕情感分析图.jpg

    孙颖莎弹幕词云图.png

  • 单元测试代码

    test_bullet_comments_crawler.py

    test_comment_analysis.py

    test_emotion_analysis.py

    test_word_cloud.py

    终端执行coverage run -m unittest tests.xxx.py 运行测试代码 执行 coverage html生成覆盖率测试报告

  • 单元测试结果.docx

使用flake8工具对代码进行分析并消除警告

使用cProfile对数据统计分析部分的代码进行性能测试,并通过snakeviz工具可视化数据结果