|
|
|
@ -23,9 +23,12 @@
|
|
|
|
|
│
|
|
|
|
|
├── release/ # 2024巴黎奥运会爬虫相关python代码文件夹
|
|
|
|
|
│ ├── mywordcloud.py # 制作出精美的词云图,里面有两种方法,第一种普通,第二种奖杯状
|
|
|
|
|
│ ├── test_1.py # 爬取一个指定BV号视频的所有弹幕
|
|
|
|
|
│ ├── test_getfor.py # for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── test_getthread.py # 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── crawl_1.py # 爬取一个指定BV号视频的所有弹幕
|
|
|
|
|
│ ├── crawl_getfor.py # for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── crawl_getthread.py # 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── test_bilibili_danmu.py # 单元测试
|
|
|
|
|
│ ├── test_数据分析.py # 单元测试
|
|
|
|
|
│ ├── test_getthread.py # 单元测试
|
|
|
|
|
│ └── 数据分析.py # 将所有.txt文件整合并输出数量排名前8的弹幕到xlsx文件中
|
|
|
|
|
│
|
|
|
|
|
├── 附加题:莎莎和陈梦/ # 莎莎和陈梦爬虫相关文件夹
|
|
|
|
@ -35,7 +38,7 @@
|
|
|
|
|
│ ├── release # 爬虫相关python代码文件夹
|
|
|
|
|
│ │ ├── emotion.py # 情感分析代码
|
|
|
|
|
│ │ ├── mywordcloud.py # 制作词云图
|
|
|
|
|
│ │ └── test_getthread.py # 线程池爬取弹幕
|
|
|
|
|
│ │ └── crawl_getthread.py # 线程池爬取弹幕
|
|
|
|
|
│ └── 弹幕收集
|
|
|
|
|
│ ├── 100个视频弹幕txt
|
|
|
|
|
│ ├── merged_text.txt # 将所有弹幕集合在一个txt文件中
|
|
|
|
|