Delete '数据统计.py'

main
pioc37juv 2 months ago
parent eaecbb59e1
commit c4bcd23702

@ -1,70 +0,0 @@
import os
import pandas as pd
def merge_csv_to_excel(folder_path, output_file):
"""合并指定文件夹下的所有 CSV 文件为一个 Excel 文件"""
all_data = pd.DataFrame()
# 遍历文件夹中的所有文件
for file_name in os.listdir(folder_path):
if file_name.endswith('.csv'): # 只处理 CSV 文件
file_path = os.path.join(folder_path, file_name) # 获取完整路径
print(f"正在读取文件: {file_path}")
# 读取 CSV 文件并追加到 all_data 中
df = pd.read_csv(file_path)
all_data = pd.concat([all_data, df], ignore_index=True) # 合并 DataFrame
# 将合并后的 DataFrame 保存到新的 Excel 文件
with pd.ExcelWriter(output_file, engine='xlsxwriter') as writer:
all_data.to_excel(writer, index=False, sheet_name='MergedData')
print(f"所有 CSV 文件已合并并保存到: {output_file}")
def analyze_danmu(input_file, output_nums_file):
"""分析合并后的 Excel 文件,统计与 AI 相关的弹幕数量,并写入结果文件"""
# 读取合并后的 Excel 文件
df = pd.read_excel(input_file)
# 假设弹幕内容在名为 '弹幕文本' 的列中
if '弹幕文本' not in df.columns:
print("弹幕数据列未找到,请检查列名。")
print("读取的列名:", df.columns.tolist()) # 打印出读取的列名以帮助调试
return
# 定义与 AI 技术应用相关的关键词
ai_keywords = ['AI', '人工智能', '机器学习', '深度学习']
# 筛选包含 AI 相关关键词的弹幕
filtered_danmu = df[df['弹幕文本'].str.contains('|'.join(ai_keywords), na=False)]
# 统计每种弹幕出现的次数
danmu_counts = filtered_danmu['弹幕文本'].value_counts()
# 获取数量排名前8的弹幕
top_danmu = danmu_counts.head(8)
# 输出结果到控制台
print("数量排名前8的弹幕")
print(top_danmu)
# 将结果写入 ai.xlsx 文件
top_danmu_df = top_danmu.reset_index()
top_danmu_df.columns = ['弹幕文本', '出现次数'] # 重命名列
with pd.ExcelWriter(output_nums_file, engine='xlsxwriter') as writer:
top_danmu_df.to_excel(writer, index=False, sheet_name='TopDanmu')
print(f"分析结果已保存到: {output_nums_file}")
if __name__ == '__main__':
folder_path = '弹幕csv' # 替换为你的 CSV 文件夹路径
output_file = '合并弹幕.xlsx' # 合并后的输出文件名
output_nums_file = 'ai.xlsx' # 分析结果输出文件名
# 合并 CSV 文件为 Excel
merge_csv_to_excel(folder_path, output_file)
# 分析弹幕数据并保存结果
analyze_danmu(output_file, output_nums_file)
Loading…
Cancel
Save