You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
pux36pf8t
c4fdce4eff
|
3 months ago | |
---|---|---|
2024软工K班个人编程任务.md | 3 months ago | |
README.md | 3 months ago | |
keywords.txt | 3 months ago | |
main.py | 3 months ago | |
stopwords.txt | 3 months ago |
README.md
#一.主任务要求 ##1.数据获取
利用爬虫B站爬取所需弹幕数据,搜索关键词“2024巴黎奥运会”,爬取综合排序前300的所有视频弹幕。
##2.数据统计
统计AI技术应该方面的每种弹幕数量,并输出数量排名前8的弹幕。 将统计的数据利用编程工具或开发包自动写入Excel表中。
##3.数据可视化
对采集的数据集进行可视化表示,制作词云图,越美观越好。
##4.数据结论
通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。
#二.代码使用的技术栈
整个代码主要使用了python语言完成。
完成基本任务所使用的技术栈如下:
- Http请求:requests
- Json解析:json
- Excel写入:pandas
- 词云生成:wordcloud
- 文件输入流:python自带内置的 open 函数