|
|
@ -17,19 +17,19 @@
|
|
|
|
├── output/ # 2024巴黎奥运会爬虫相关输出文件夹
|
|
|
|
├── output/ # 2024巴黎奥运会爬虫相关输出文件夹
|
|
|
|
│ ├── 弹幕收集按序 # 综合排序前300的所有视频弹幕txt文件夹
|
|
|
|
│ ├── 弹幕收集按序 # 综合排序前300的所有视频弹幕txt文件夹
|
|
|
|
│ ├── wordcloud.jpg # 普通词云图
|
|
|
|
│ ├── wordcloud.jpg # 普通词云图
|
|
|
|
│ ├── wordcloud_cup.png # 奖杯词云图
|
|
|
|
│ ├── wordcloud_cup.png # 奖杯词云图
|
|
|
|
│ ├── 奖杯.png # 奖杯掩膜图
|
|
|
|
│ ├── 奖杯.png # 奖杯掩膜图
|
|
|
|
│ └── 统计结果top_8_withBV号.xlsx # 数量排名前8的弹幕
|
|
|
|
│ └── 统计结果top_8_withBV号.xlsx # 数量排名前8的弹幕
|
|
|
|
│
|
|
|
|
│
|
|
|
|
├── release/ # 2024巴黎奥运会爬虫相关python代码文件夹
|
|
|
|
├── release/ # 2024巴黎奥运会爬虫相关python代码文件夹
|
|
|
|
│ ├── mywordcloud.py # 制作出精美的词云图,里面有两种方法,第一种普通,第二种奖杯状
|
|
|
|
│ ├── mywordcloud.py # 制作出精美的词云图,里面有两种方法,第一种普通,第二种奖杯状
|
|
|
|
│ ├── crawl_1.py # 爬取一个指定BV号视频的所有弹幕
|
|
|
|
│ ├── crawl_1.py # 爬取一个指定BV号视频的所有弹幕
|
|
|
|
│ ├── crawl_getfor.py # for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
│ ├── crawl_getfor.py # for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
│ ├── crawl_getthread.py # 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
│ ├── crawl_getthread.py # 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
│ ├── test_bilibili_danmu.py # 单元测试
|
|
|
|
│ ├── test_bilibili_danmu.py # 单元测试
|
|
|
|
│ ├── test_数据分析.py # 单元测试
|
|
|
|
│ ├── test_数据分析.py # 单元测试
|
|
|
|
│ ├── test_getthread.py # 单元测试
|
|
|
|
│ ├── test_getthread.py # 单元测试
|
|
|
|
│ └── 数据分析.py # 将所有.txt文件整合并输出数量排名前8的弹幕到xlsx文件中
|
|
|
|
│ └── 数据分析.py # 将所有.txt文件整合并输出数量排名前8的弹幕到xlsx文件中
|
|
|
|
│
|
|
|
|
│
|
|
|
|
├── 附加题:莎莎和陈梦/ # 莎莎和陈梦爬虫相关文件夹
|
|
|
|
├── 附加题:莎莎和陈梦/ # 莎莎和陈梦爬虫相关文件夹
|
|
|
|
│ ├── output # 输出结果文件夹
|
|
|
|
│ ├── output # 输出结果文件夹
|
|
|
|