From 91e03b332ff0ca0572d6cb45bf7723af82c0c6ab Mon Sep 17 00:00:00 2001 From: pux36pf8t <3187933100@qq.com> Date: Mon, 9 Sep 2024 21:41:52 +0800 Subject: [PATCH] =?UTF-8?q?Add=20=E9=A2=98=E7=9B=AE=E6=8F=8F=E8=BF=B0?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- 题目描述 | 93 ++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 file changed, 93 insertions(+) create mode 100644 题目描述 diff --git a/题目描述 b/题目描述 new file mode 100644 index 0000000..f3f6b09 --- /dev/null +++ b/题目描述 @@ -0,0 +1,93 @@ +Part·1 任务背景 +2024年第三十三届夏季奥林匹克运动会(2024 Summer Olympics),一般称为2024巴黎奥运会(Paris 2024),于2024年7月26日至8月11日在法国巴黎举行,此次为法国相隔100年后再次举办夏季奥运会。巴黎成为继英国伦敦后,第二个三度举办夏季奥运会的城市,前两次分别在1900年及1924年举办。最终,美国代表团以40枚金牌、126枚奖牌,坐拥奖牌榜首位;中国代表团以40枚金牌、91枚奖牌排名第二;东道主法国代表团则拿下16枚金牌、64枚奖牌位列第五。本届是现代夏季奥运会历史以来,第二次有多于一个国家的代表团(美国和中国),获得最多且同样数量的金牌。 + +2024巴黎奥运会,这场体育盛宴不仅承载着运动员的汗水与梦想,更是工业数字化浪潮的壮阔展示。在这场跨越国界的竞技中,数字科技如同隐形的魔术师,悄然编织着赛事的每一个细节,从幕后到台前,从组织策划到观众体验,全方位塑造着奥运会的面貌,让我们见证了一个科技与体育深度融合的新时代。 + +本次作业要求实现2024巴黎奥运会视频弹幕分析,使用爬虫在B站爬取相关视频弹幕,并给出数量排名前8项关于本次赛事应用AI技术的弹幕,同时所有数据进行词云可视化分析,最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。 + +Part·2 任务要求 +2.1 数据获取 +利用爬虫B站爬取所需弹幕数据,搜索关键词“2024巴黎奥运会”,爬取综合排序前300的所有视频弹幕。 +2.2 数据统计 +统计AI技术应该方面的每种弹幕数量,并输出数量排名前8的弹幕。 +将统计的数据利用编程工具或开发包自动写入Excel表中。 +2.3 数据可视化 +对采集的数据集进行可视化表示,制作词云图,越美观越好。 +2.4 数据结论 +通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。 +2.5 附加题 +爬取世界主流媒体的观点,预测事件走向。 +自主发挥:爬取有趣的数据进行分析、制作数据可视化大屏等,有创意有乐趣即可。 +Part·3 编码要求 +在头歌平台https://code.educoder.net/projects中新建一个**学号为名**的文件夹。 +在开始实现程序之前,在PSP表格[附录1]记录下你估计在程序开发各个步骤上耗费的时间,在你实现程序之后,在PSP表格记录下你在程序的各个模块上实际花费的时间。 +使用C++、Java或者Python3实现,提交python代码时请附带上requirements.txt。请使用Visual Studio Code进行开发。对于C++/Java,还需将编译好的程序发布到https://code.educoder.net/projects仓库中的releases中。 +提交的代码尽可能经过Code Quality Analysis工具的分析并消除所有的警告。 +完成项目的首个版本之后,请使用性能分析工具(例如Studio Profiling Tools)来找出代码中的性能瓶颈并进行改进。 +使用https://code.educoder.net/projects来管理源代码和测试用例,**代码有进展即签入https://code.educoder.net/projects**。签入记录不合理的项目可能会被询问项目细节。 +使用单元测试[附录3]对项目进行测试,并使用插件查看测试分支覆盖率等指标。 +Git代码管理方法学习可参考https://www.educoder.net/paths/41 +Part·4 评分细则 +4.1 得分表 +评分点 描述 得分 +1.1 在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹,同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。 2 +2.1 在开始实现程序之前,用附录提供的PSP表格记录下在各个模块上开发的预估耗时 3 +2.2 在完成程序之后,用附录提供的PSP表格记录下在各个模块上开发的实际耗时 3 +3.1 项目设计与技术栈 5 +3.2 爬虫与数据处理 20 +3.3 数据统计接口部分的性能改进 6 +3.4 数据结论的可靠性 6 +3.5 数据可视化界面的展示 15 +4.1 完成作业过程中的心得体会。 10 +5.1 项目结构的完整性(单元测试、异常处理、模块设计是否满足低耦合的要求) 10 +5.2 代码的可读性(注释等) 10 +5.3 变量、函数、类命名的规范化 10 +6.1 附加题:能否正确爬取世界主流媒体的观点,预测事件的概率性走向。 +10 +6.2 附加题:除了任务要求三点外的,自行实现其他与题目相关的创新功能与内容。在博客中给出:功能的实现思路(简单描述)、功能的创新点以及对于该功能能过解决的问题或者内容 +10 +4.1.1 博客评分规则(70%) +1.(1.1)在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹,同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。**(2')** + +请用以下列一级标题分割你的博客(冒号后的文字设置为一级标题) + +——博客评分为半自动,如果没有按要求分割博客,造成评分出现问题,将不予处理 + +2.标题一:一、PSP表格 + +(2.1)在开始实现程序之前,在附录提供的PSP表格记录下你估计将在程序的各个模块的开发上耗费的时间。(3') + +(2.2)在你实现完程序之后,在附录提供的PSP表格记录下你在程序的各个模块上实际花费的时间。(3') + +3.标题二:二、任务要求的实现 + +(3.1)项目设计与技术栈。从阅读完题目到完成作业,这一次的任务被你拆分成了几个环节?你分别通过什么渠道、使用什么方式方法完成了各个环节?列出你完成本次任务所使用的技术栈。(5') + +(3.2)爬虫与数据处理。说明业务逻辑,简述代码的设计过程(例如可介绍有几个类,几个函数,他们之间的关系),并对关键的函数或算法进行说明。(20') + +(3.3)数据统计接口部分的性能改进。记录在数据统计接口的性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(例如可通过VS /JProfiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。(6') + +(3.4)数据结论的可靠性。介绍结论的内容,以及通过什么数据以及何种判断方式得出此结论(6') + +(3.5)数据可视化界面的展示。在博客中介绍数据可视化界面的组件和设计的思路。(15') + +4.标题三:三、心得体会 + +(4.1)在这儿写下你完成本次作业的心得体会,当然,如果你还有想表达的东西但在上面两个板块没有体现,也可以写在这儿~(10') + +4.1.2 代码评分规则(30%) +总分30分,程序评分是根据代码质量综合考量给出的评分,主要考察如下方面: + +项目结构的完整性(单元测试、异常处理、模块设计是否满足低耦合的要求)(10') + +代码的可读性(注释等)(10') + +变量、函数、类命名的规范化(10') + +4.2 扣分规则 +作业截止后发布博文:作业截止24小时内补交在原分数上扣20分,24-48小时内扣40分,48-72小时内扣60分,以此类推扣到0分为止; +发布博文但未提交任务:24小时内补提交扣10分,24-48小时内扣20分,48-72小时内扣30分,以此类推扣到0分为止(请注意:本次作业开始,不会再在QQ课程群中提醒需要提交任务); +缺交:以上两项扣分规则仅适用于在作业截止之后、评测开始之前补提交的情况!作业截止后任意时间开始进行评测,评测开始的具体时间不会提前告知,评测开始时仍未发布博客或未提交任务均视为缺交,评为0分; +抄袭:后台检测到的不诚信行为评为0分。 +Part·5 注意事项 +撰写博文时,请在编辑区右上角选择【切换为MarkDown】,使用MarkDown语言撰写今后的博客文档; +将作业标题严格命名为2024软工K班个人编程任务,不要修改。 +因时间不同可能导致B站视频排序出现变化,此变化无影响,保证爬取的弹幕来自综合排序前300的相关视频即可 \ No newline at end of file