You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1.2 KiB

项目描述

这个项目是一个用于分析Bilibili弹幕数据的Python脚本集合。它包括从Bilibili API获取视频ID和弹幕内容、提取AI相关弹幕、生成词云图片等功能。

安装指南

依赖

  • requests
  • json
  • re
  • openpyxl
  • wordcloud
  • jieba

安装步骤

  1. 打开命令行工具cmd或终端
  2. 运行 pip3 install requests json re csv openpyxl wordcloud jieba

使用说明

基本用法

1.先通过aid.py爬取对应aid该代码会将aid存储在aid.txt 2.通过爬取到的aid.txt,使用cid.py爬取对应的cid并存储在cid.py中 3.通过爬取到的cid.txt通过B站弹幕.py爬取并处理弹幕信息然后存储在弹幕.txt 4.用数据统计.py对弹幕进行统计我们要的相关弹幕并将其用excel表格收集 5.最后通过词云.py,绘制词云图

高级用法

  1. 您可以自定义搜索关键词,只需在 main.py 中更改 '2024巴黎奥运会' 为您想要的关键词。
  2. 您还可以在 main.py 中更改Cookie值以便脚本能够正常访问Bilibili API。

贡献者

  • 102201607刘程城

许可协议

该项目遵循MIT许可协议。