From c4bcd23702f0a018c3a7f9799fcc721ec6d95048 Mon Sep 17 00:00:00 2001 From: pioc37juv <1245880206@qq.com> Date: Wed, 18 Sep 2024 02:37:35 +0800 Subject: [PATCH] =?UTF-8?q?Delete=20'=E6=95=B0=E6=8D=AE=E7=BB=9F=E8=AE=A1.?= =?UTF-8?q?py'?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 数据统计.py | 70 ------------------------------------------------- 1 file changed, 70 deletions(-) delete mode 100644 数据统计.py diff --git a/数据统计.py b/数据统计.py deleted file mode 100644 index 48a42d4..0000000 --- a/数据统计.py +++ /dev/null @@ -1,70 +0,0 @@ -import os -import pandas as pd - - -def merge_csv_to_excel(folder_path, output_file): - """合并指定文件夹下的所有 CSV 文件为一个 Excel 文件""" - all_data = pd.DataFrame() - - # 遍历文件夹中的所有文件 - for file_name in os.listdir(folder_path): - if file_name.endswith('.csv'): # 只处理 CSV 文件 - file_path = os.path.join(folder_path, file_name) # 获取完整路径 - print(f"正在读取文件: {file_path}") - # 读取 CSV 文件并追加到 all_data 中 - df = pd.read_csv(file_path) - all_data = pd.concat([all_data, df], ignore_index=True) # 合并 DataFrame - - # 将合并后的 DataFrame 保存到新的 Excel 文件 - with pd.ExcelWriter(output_file, engine='xlsxwriter') as writer: - all_data.to_excel(writer, index=False, sheet_name='MergedData') - - print(f"所有 CSV 文件已合并并保存到: {output_file}") - - -def analyze_danmu(input_file, output_nums_file): - """分析合并后的 Excel 文件,统计与 AI 相关的弹幕数量,并写入结果文件""" - # 读取合并后的 Excel 文件 - df = pd.read_excel(input_file) - - # 假设弹幕内容在名为 '弹幕文本' 的列中 - if '弹幕文本' not in df.columns: - print("弹幕数据列未找到,请检查列名。") - print("读取的列名:", df.columns.tolist()) # 打印出读取的列名以帮助调试 - return - - # 定义与 AI 技术应用相关的关键词 - ai_keywords = ['AI', '人工智能', '机器学习', '深度学习'] - - # 筛选包含 AI 相关关键词的弹幕 - filtered_danmu = df[df['弹幕文本'].str.contains('|'.join(ai_keywords), na=False)] - - # 统计每种弹幕出现的次数 - danmu_counts = filtered_danmu['弹幕文本'].value_counts() - - # 获取数量排名前8的弹幕 - top_danmu = danmu_counts.head(8) - - # 输出结果到控制台 - print("数量排名前8的弹幕:") - print(top_danmu) - - # 将结果写入 ai.xlsx 文件 - top_danmu_df = top_danmu.reset_index() - top_danmu_df.columns = ['弹幕文本', '出现次数'] # 重命名列 - with pd.ExcelWriter(output_nums_file, engine='xlsxwriter') as writer: - top_danmu_df.to_excel(writer, index=False, sheet_name='TopDanmu') - - print(f"分析结果已保存到: {output_nums_file}") - - -if __name__ == '__main__': - folder_path = '弹幕csv' # 替换为你的 CSV 文件夹路径 - output_file = '合并弹幕.xlsx' # 合并后的输出文件名 - output_nums_file = 'ai.xlsx' # 分析结果输出文件名 - - # 合并 CSV 文件为 Excel - merge_csv_to_excel(folder_path, output_file) - - # 分析弹幕数据并保存结果 - analyze_danmu(output_file, output_nums_file)