You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
|
|
2 months ago | |
|---|---|---|
| README.md | 2 months ago | |
| analyzer.py | 2 months ago | |
| crawler.py | 2 months ago | |
| data_processor.py | 2 months ago | |
| main.py | 2 months ago | |
| psp_table.md | 2 months ago | |
| requirements.txt | 2 months ago | |
| visualizer.py | 2 months ago | |
README.md
202501001-llm-analysis
大语言模型应用评论分析项目
项目简介
基于B站弹幕数据,分析大语言模型(LLM)应用现状和用户看法,完成数据爬取、处理、可视化和分析全流程。
项目背景
- 选题:2025年【大语言模型应用评论分析】
- 数据源:B站视频弹幕
- 关键词:"大语言模型"、"LLM"、"大模型"等
功能模块
| 模块 | 文件 | 功能 |
|---|---|---|
| 主程序 | main.py |
程序入口,协调各模块 |
| 数据爬取 | crawler.py |
B站视频搜索和弹幕获取 |
| 数据处理 | data_processor.py |
数据清洗、分词、统计 |
| 可视化 | visualizer.py |
词云图、词频图生成 |
| 分析 | analyzer.py |
应用案例提取、情感分析 |
运行方法
- 安装依赖:
pip install -r requirements.txt - 运行程序:
py main.py
生成文件
output/wordcloud.png- 弹幕词云图output/top_words.png- 词频统计图output/analysis_results.xlsx- 分析数据表格output/analysis_report.txt- 分析结论报告data/videos_list.csv- 视频信息列表
技术栈
- Python 3.10.8
- 数据处理:pandas, jieba
- 可视化:matplotlib, wordcloud
- 网络请求:requests
开发者
- 学号:[102301308]
- 姓名:[陈梓旸]