You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
fzu102301308 8e11e5f9d3
Update psp_table.md
2 months ago
README.md Update README.md 2 months ago
analyzer.py Add analyzer.py 2 months ago
crawler.py Update crawler.py 2 months ago
data_processor.py Add data_processor.py 2 months ago
main.py Add main.py 2 months ago
psp_table.md Update psp_table.md 2 months ago
requirements.txt Add requirements.txt 2 months ago
visualizer.py Add visualizer.py 2 months ago

README.md

202501001-llm-analysis

大语言模型应用评论分析项目

项目简介

基于B站弹幕数据分析大语言模型(LLM)应用现状和用户看法,完成数据爬取、处理、可视化和分析全流程。

项目背景

  • 选题2025年【大语言模型应用评论分析】
  • 数据源B站视频弹幕
  • 关键词:"大语言模型"、"LLM"、"大模型"等

功能模块

模块 文件 功能
主程序 main.py 程序入口,协调各模块
数据爬取 crawler.py B站视频搜索和弹幕获取
数据处理 data_processor.py 数据清洗、分词、统计
可视化 visualizer.py 词云图、词频图生成
分析 analyzer.py 应用案例提取、情感分析

运行方法

  1. 安装依赖:pip install -r requirements.txt
  2. 运行程序:py main.py

生成文件

  • output/wordcloud.png - 弹幕词云图
  • output/top_words.png - 词频统计图
  • output/analysis_results.xlsx - 分析数据表格
  • output/analysis_report.txt - 分析结论报告
  • data/videos_list.csv - 视频信息列表

技术栈

  • Python 3.10.8
  • 数据处理pandas, jieba
  • 可视化matplotlib, wordcloud
  • 网络请求requests

开发者

  • 学号:[102301308]
  • 姓名:[陈梓旸]