You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

42 lines
1.2 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

### 项目描述
这个项目是一个用于分析Bilibili弹幕数据的Python脚本集合。它包括从Bilibili API获取视频ID和弹幕内容、提取AI相关弹幕、生成词云图片等功能。
## 安装指南
### 依赖
- requests
- json
- re
- openpyxl
- wordcloud
- jieba
### 安装步骤
1. 打开命令行工具cmd或终端
2. 运行 `pip3 install requests json re csv openpyxl wordcloud jieba`
## 使用说明
### 基本用法
1.先通过aid.py爬取对应aid该代码会将aid存储在aid.txt
2.通过爬取到的aid.txt,使用cid.py爬取对应的cid并存储在cid.py中
3.通过爬取到的cid.txt通过B站弹幕.py爬取并处理弹幕信息然后存储在弹幕.txt
4.用数据统计.py对弹幕进行统计我们要的相关弹幕并将其用excel表格收集
5.最后通过词云.py,绘制词云图
### 高级用法
1. 您可以自定义搜索关键词,只需在 `main.py` 中更改 `'2024巴黎奥运会'` 为您想要的关键词。
2. 您还可以在 `main.py` 中更改Cookie值以便脚本能够正常访问Bilibili API。
## 贡献者
- 102201607刘程城
## 许可协议
该项目遵循MIT许可协议。