You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
1.2 KiB
1.2 KiB
项目描述
这个项目是一个用于分析Bilibili弹幕数据的Python脚本集合。它包括从Bilibili API获取视频ID和弹幕内容、提取AI相关弹幕、生成词云图片等功能。
安装指南
依赖
- requests
- json
- re
- openpyxl
- wordcloud
- jieba
安装步骤
- 打开命令行工具(cmd或终端)。
- 运行
pip3 install requests json re csv openpyxl wordcloud jieba
。
使用说明
基本用法
1.先通过aid.py爬取对应aid,该代码会将aid存储在aid.txt 2.通过爬取到的aid.txt,使用cid.py爬取对应的cid,并存储在cid.py中 3.通过爬取到的cid.txt,通过B站弹幕.py爬取并处理弹幕信息,然后存储在弹幕.txt 4.用数据统计.py对弹幕进行统计我们要的相关弹幕,并将其用excel表格收集 5.最后通过词云.py,绘制词云图
高级用法
- 您可以自定义搜索关键词,只需在
main.py
中更改'2024巴黎奥运会'
为您想要的关键词。 - 您还可以在
main.py
中更改Cookie值,以便脚本能够正常访问Bilibili API。
贡献者
- 102201607刘程城
许可协议
该项目遵循MIT许可协议。