You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
pux36pf8t 1445d0a6d1
extra commit
11 months ago
2024软工K班个人编程任务.md first commit 11 months ago
README.md first commit 11 months ago
keywords.txt first commit 11 months ago
main.py first commit 11 months ago
stopwords.txt first commit 11 months ago
附加题3.py extra commit 11 months ago

README.md

#一.主任务要求 ##1.数据获取

利用爬虫B站爬取所需弹幕数据搜索关键词“2024巴黎奥运会”爬取综合排序前300的所有视频弹幕。

##2.数据统计

统计AI技术应该方面的每种弹幕数量并输出数量排名前8的弹幕。 将统计的数据利用编程工具或开发包自动写入Excel表中。

##3.数据可视化

对采集的数据集进行可视化表示,制作词云图,越美观越好。

##4.数据结论

通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。

#二.代码使用的技术栈

整个代码主要使用了python语言完成。

完成基本任务所使用的技术栈如下:

  • Http请求requests
  • Json解析json
  • Excel写入pandas
  • 词云生成wordcloud
  • 文件输入流python自带内置的 open 函数