|
|
|
@ -80,17 +80,19 @@
|
|
|
|
|
本程序得出的结论比较多,以下是结论介绍和相关的数据判断:
|
|
|
|
|
1) **b站用户对于弹幕讨论巴黎奥运会的ai使用并不感兴趣。** 统计了b站搜索“2024巴黎奥运会”综合排序前300的视频弹幕,并对弹幕应用了ai、智能等关键字提取,最终发现基本没几个相关弹幕,弹幕数量最多的还是“该内容疑似使用AI技术合成,请谨慎甄别”,不能说和巴黎奥运会没有关系,只能说和巴黎奥运会毫不相关。
|
|
|
|
|
2) **b站用户在弹幕讨论中,正向情绪远大于负向情绪。** 不仅可以从词云图中看出,b站用户在巴黎奥运会相关视频发送的最多的弹幕是“哈哈哈”、“好看”、“加油”等等积极正向的词语;也能通过后续的弹幕情绪分析中看出,1000个弹幕中,正向情绪的弹幕有658个,负向情绪的弹幕有341个,正向接近负向的两倍,而且,弹幕的情绪可信度也非常高,正向与负向的情绪可信度均接近90%。
|
|
|
|
|
![avatar][img_4]
|
|
|
|
|
<font size=2><center> *弹幕词云图* </center></font>
|
|
|
|
|
![avatar][img_5]
|
|
|
|
|
<font size=2><center> *弹幕情绪倾向图* </center></font>
|
|
|
|
|
|
|
|
|
|
## 5. 数据可视化界面的展示
|
|
|
|
|
#### 在博客中介绍数据可视化界面的组件和设计的思路。(15')
|
|
|
|
|
数据可视化主要是通过matplotlib: 数据可视化库、wordcloud: 词云生成库以及Pillow: 图像处理库函数来实现的。
|
|
|
|
|
1) 考虑到词云生成为**默认的长方形不够美观**,因此**特地从网络上找到了巴黎奥运会吉祥物的标志性图片,并将词云图中的文字按图片颜色排版**,最终得到了现在的词云图片,观感好上了不少。
|
|
|
|
|
![avatar][img_4]
|
|
|
|
|
<font size=2><center> *弹幕词云图* </center></font>
|
|
|
|
|
|
|
|
|
|
2) 虽然我利用了自然文本处理模型,对弹幕文本进行了情绪倾向分析,但这些都只是文本的内容。个人认为,单纯的文本内容表述不足以给出直观的数据展示,因此我将这部分内容以**信息量最大、比较直观的正向负向柱形图**的形式展现出来。
|
|
|
|
|
|
|
|
|
|
![avatar][img_5]
|
|
|
|
|
<font size=2><center> *弹幕情绪倾向图* </center></font>
|
|
|
|
|
|
|
|
|
|
# 三、心得体会
|
|
|
|
|
#### 在这儿写下你完成本次作业的心得体会,当然,如果你还有想表达的东西但在上面两个板块没有体现,也可以写在这儿~(10')
|
|
|
|
|
本次作业是我**第一次尝试以python完成一个这么大类的一个程序**,也是我**第一次接触到项目管理中的单元测试、代码覆盖率等待程序性能优化相关的内容**,受益匪浅。不论是代码编写能力还是程序的设计能力,都有了足量的提升。
|
|
|
|
|