You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

29 lines
856 B

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

#一.主任务要求
##1.数据获取
利用爬虫B站爬取所需弹幕数据搜索关键词“2024巴黎奥运会”爬取综合排序前300的所有视频弹幕。
##2.数据统计
统计AI技术应该方面的每种弹幕数量并输出数量排名前8的弹幕。
将统计的数据利用编程工具或开发包自动写入Excel表中。
##3.数据可视化
对采集的数据集进行可视化表示,制作词云图,越美观越好。
##4.数据结论
通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。
#二.代码使用的技术栈
整个代码主要使用了python语言完成。
完成基本任务所使用的技术栈如下:
* Http请求requests
* Json解析json
* Excel写入pandas
* 词云生成wordcloud
* 文件输入流python自带内置的 open 函数