|
|
|
@ -14,33 +14,32 @@
|
|
|
|
|
```
|
|
|
|
|
102201613/
|
|
|
|
|
│
|
|
|
|
|
├── output/ 2024巴黎奥运会爬虫相关输出文件夹
|
|
|
|
|
│ ├── 弹幕收集按序 综合排序前300的所有视频弹幕txt文件夹
|
|
|
|
|
│ ├── wordcloud.jpg 普通词云图
|
|
|
|
|
│ ├── wordcloud_cup.png 奖杯词云图
|
|
|
|
|
│ ├── 奖杯.png 奖杯掩膜图
|
|
|
|
|
│ └── 统计结果top_8_withBV号.xlsx 数量排名前8的弹幕
|
|
|
|
|
├── output/ # 2024巴黎奥运会爬虫相关输出文件夹
|
|
|
|
|
│ ├── 弹幕收集按序 # 综合排序前300的所有视频弹幕txt文件夹
|
|
|
|
|
│ ├── wordcloud.jpg # 普通词云图
|
|
|
|
|
│ ├── wordcloud_cup.png # 奖杯词云图
|
|
|
|
|
│ ├── 奖杯.png # 奖杯掩膜图
|
|
|
|
|
│ └── 统计结果top_8_withBV号.xlsx # 数量排名前8的弹幕
|
|
|
|
|
│
|
|
|
|
|
├── release/ 2024巴黎奥运会爬虫相关python代码文件夹
|
|
|
|
|
│ ├── mywordcloud.py 制作出精美的词云图,里面有两种方法,第一种普通,第二种奖杯状
|
|
|
|
|
│ ├── test_1.py 爬取一个指定BV号视频的所有弹幕
|
|
|
|
|
│ ├── test_getfor.py for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── test_getthread.py 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ └──数据分析.py 将所有.txt文件整合并输出数量排名前8的弹幕到xlsx文件中
|
|
|
|
|
├── release/ # 2024巴黎奥运会爬虫相关python代码文件夹
|
|
|
|
|
│ ├── mywordcloud.py # 制作出精美的词云图,里面有两种方法,第一种普通,第二种奖杯状
|
|
|
|
|
│ ├── test_1.py # 爬取一个指定BV号视频的所有弹幕
|
|
|
|
|
│ ├── test_getfor.py # for循环一条一条爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ ├── test_getthread.py # 优化–利用线程池并发爬取综合排序前300的所有视频弹幕
|
|
|
|
|
│ └── 数据分析.py # 将所有.txt文件整合并输出数量排名前8的弹幕到xlsx文件中
|
|
|
|
|
│
|
|
|
|
|
├── 附加题:莎莎和陈梦/ 莎莎和陈梦爬虫相关文件夹
|
|
|
|
|
│ ├── output 输出结果文件夹
|
|
|
|
|
│ │ ├── 弹幕情感分析结果图.jpg
|
|
|
|
|
│ │ └──词云图.jpg
|
|
|
|
|
│ ├── release 爬虫相关python代码文件夹
|
|
|
|
|
│ │ ├── emotion.py 情感分析代码
|
|
|
|
|
│ │ ├── mywordcloud.py 制作词云图
|
|
|
|
|
│ │ └── test_getthread.py 线程池爬取弹幕
|
|
|
|
|
│ └── 弹幕收集
|
|
|
|
|
│ │ ├── 100个视频弹幕txt
|
|
|
|
|
│ │ ├── merged_text.txt 将所有弹幕集合在一个txt文件中
|
|
|
|
|
│ │ └── sentiment_analysis_results.csv 情感分析结果
|
|
|
|
|
│
|
|
|
|
|
└── requirements.txt 相关库版本控制
|
|
|
|
|
├── 附加题:莎莎和陈梦/ # 莎莎和陈梦爬虫相关文件夹
|
|
|
|
|
│ ├── output # 输出结果文件夹
|
|
|
|
|
│ │ ├── 弹幕情感分析结果图.jpg # 弹幕情感分析结果图
|
|
|
|
|
│ │ └── 词云图.jpg # 词云图
|
|
|
|
|
│ ├── release # 爬虫相关python代码文件夹
|
|
|
|
|
│ │ ├── emotion.py # 情感分析代码
|
|
|
|
|
│ │ ├── mywordcloud.py # 制作词云图
|
|
|
|
|
│ │ └── test_getthread.py # 线程池爬取弹幕
|
|
|
|
|
│ └── 弹幕收集
|
|
|
|
|
│ ├── 100个视频弹幕txt
|
|
|
|
|
│ ├── merged_text.txt # 将所有弹幕集合在一个txt文件中
|
|
|
|
|
│ └── sentiment_analysis_results.csv # 情感分析结果
|
|
|
|
|
└── requirements.txt # 相关库版本控制
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|