You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
|
|
### 项目描述
|
|
|
|
|
|
|
|
|
|
这个项目是一个用于分析Bilibili弹幕数据的Python脚本集合。它包括从Bilibili API获取视频ID和弹幕内容、提取AI相关弹幕、生成词云图片等功能。
|
|
|
|
|
|
|
|
|
|
## 安装指南
|
|
|
|
|
|
|
|
|
|
### 依赖
|
|
|
|
|
|
|
|
|
|
- requests
|
|
|
|
|
- json
|
|
|
|
|
- re
|
|
|
|
|
- openpyxl
|
|
|
|
|
- wordcloud
|
|
|
|
|
- jieba
|
|
|
|
|
|
|
|
|
|
### 安装步骤
|
|
|
|
|
|
|
|
|
|
1. 打开命令行工具(cmd或终端)。
|
|
|
|
|
2. 运行 `pip3 install requests json re csv openpyxl wordcloud jieba`。
|
|
|
|
|
|
|
|
|
|
## 使用说明
|
|
|
|
|
|
|
|
|
|
### 基本用法
|
|
|
|
|
1.先通过aid.py爬取对应aid,该代码会将aid存储在aid.txt
|
|
|
|
|
2.通过爬取到的aid.txt,使用cid.py爬取对应的cid,并存储在cid.py中
|
|
|
|
|
3.通过爬取到的cid.txt,通过B站弹幕.py爬取并处理弹幕信息,然后存储在弹幕.txt
|
|
|
|
|
4.用数据统计.py对弹幕进行统计我们要的相关弹幕,并将其用excel表格收集
|
|
|
|
|
5.最后通过词云.py,绘制词云图
|
|
|
|
|
### 高级用法
|
|
|
|
|
|
|
|
|
|
1. 您可以自定义搜索关键词,只需在 `main.py` 中更改 `'2024巴黎奥运会'` 为您想要的关键词。
|
|
|
|
|
2. 您还可以在 `main.py` 中更改Cookie值,以便脚本能够正常访问Bilibili API。
|
|
|
|
|
|
|
|
|
|
## 贡献者
|
|
|
|
|
|
|
|
|
|
- 102201607刘程城
|
|
|
|
|
|
|
|
|
|
## 许可协议
|
|
|
|
|
|
|
|
|
|
该项目遵循MIT许可协议。
|
|
|
|
|
|