|
|
|
@ -1,93 +0,0 @@
|
|
|
|
|
Part·1 任务背景
|
|
|
|
|
2024年第三十三届夏季奥林匹克运动会(2024 Summer Olympics),一般称为2024巴黎奥运会(Paris 2024),于2024年7月26日至8月11日在法国巴黎举行,此次为法国相隔100年后再次举办夏季奥运会。巴黎成为继英国伦敦后,第二个三度举办夏季奥运会的城市,前两次分别在1900年及1924年举办。最终,美国代表团以40枚金牌、126枚奖牌,坐拥奖牌榜首位;中国代表团以40枚金牌、91枚奖牌排名第二;东道主法国代表团则拿下16枚金牌、64枚奖牌位列第五。本届是现代夏季奥运会历史以来,第二次有多于一个国家的代表团(美国和中国),获得最多且同样数量的金牌。
|
|
|
|
|
|
|
|
|
|
2024巴黎奥运会,这场体育盛宴不仅承载着运动员的汗水与梦想,更是工业数字化浪潮的壮阔展示。在这场跨越国界的竞技中,数字科技如同隐形的魔术师,悄然编织着赛事的每一个细节,从幕后到台前,从组织策划到观众体验,全方位塑造着奥运会的面貌,让我们见证了一个科技与体育深度融合的新时代。
|
|
|
|
|
|
|
|
|
|
本次作业要求实现2024巴黎奥运会视频弹幕分析,使用爬虫在B站爬取相关视频弹幕,并给出数量排名前8项关于本次赛事应用AI技术的弹幕,同时所有数据进行词云可视化分析,最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。
|
|
|
|
|
|
|
|
|
|
Part·2 任务要求
|
|
|
|
|
2.1 数据获取
|
|
|
|
|
利用爬虫B站爬取所需弹幕数据,搜索关键词“2024巴黎奥运会”,爬取综合排序前300的所有视频弹幕。
|
|
|
|
|
2.2 数据统计
|
|
|
|
|
统计AI技术应该方面的每种弹幕数量,并输出数量排名前8的弹幕。
|
|
|
|
|
将统计的数据利用编程工具或开发包自动写入Excel表中。
|
|
|
|
|
2.3 数据可视化
|
|
|
|
|
对采集的数据集进行可视化表示,制作词云图,越美观越好。
|
|
|
|
|
2.4 数据结论
|
|
|
|
|
通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。
|
|
|
|
|
2.5 附加题
|
|
|
|
|
爬取世界主流媒体的观点,预测事件走向。
|
|
|
|
|
自主发挥:爬取有趣的数据进行分析、制作数据可视化大屏等,有创意有乐趣即可。
|
|
|
|
|
Part·3 编码要求
|
|
|
|
|
在头歌平台https://code.educoder.net/projects中新建一个**学号为名**的文件夹。
|
|
|
|
|
在开始实现程序之前,在PSP表格[附录1]记录下你估计在程序开发各个步骤上耗费的时间,在你实现程序之后,在PSP表格记录下你在程序的各个模块上实际花费的时间。
|
|
|
|
|
使用C++、Java或者Python3实现,提交python代码时请附带上requirements.txt。请使用Visual Studio Code进行开发。对于C++/Java,还需将编译好的程序发布到https://code.educoder.net/projects仓库中的releases中。
|
|
|
|
|
提交的代码尽可能经过Code Quality Analysis工具的分析并消除所有的警告。
|
|
|
|
|
完成项目的首个版本之后,请使用性能分析工具(例如Studio Profiling Tools)来找出代码中的性能瓶颈并进行改进。
|
|
|
|
|
使用https://code.educoder.net/projects来管理源代码和测试用例,**代码有进展即签入https://code.educoder.net/projects**。签入记录不合理的项目可能会被询问项目细节。
|
|
|
|
|
使用单元测试[附录3]对项目进行测试,并使用插件查看测试分支覆盖率等指标。
|
|
|
|
|
Git代码管理方法学习可参考https://www.educoder.net/paths/41
|
|
|
|
|
Part·4 评分细则
|
|
|
|
|
4.1 得分表
|
|
|
|
|
评分点 描述 得分
|
|
|
|
|
1.1 在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹,同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。 2
|
|
|
|
|
2.1 在开始实现程序之前,用附录提供的PSP表格记录下在各个模块上开发的预估耗时 3
|
|
|
|
|
2.2 在完成程序之后,用附录提供的PSP表格记录下在各个模块上开发的实际耗时 3
|
|
|
|
|
3.1 项目设计与技术栈 5
|
|
|
|
|
3.2 爬虫与数据处理 20
|
|
|
|
|
3.3 数据统计接口部分的性能改进 6
|
|
|
|
|
3.4 数据结论的可靠性 6
|
|
|
|
|
3.5 数据可视化界面的展示 15
|
|
|
|
|
4.1 完成作业过程中的心得体会。 10
|
|
|
|
|
5.1 项目结构的完整性(单元测试、异常处理、模块设计是否满足低耦合的要求) 10
|
|
|
|
|
5.2 代码的可读性(注释等) 10
|
|
|
|
|
5.3 变量、函数、类命名的规范化 10
|
|
|
|
|
6.1 附加题:能否正确爬取世界主流媒体的观点,预测事件的概率性走向。 +10
|
|
|
|
|
6.2 附加题:除了任务要求三点外的,自行实现其他与题目相关的创新功能与内容。在博客中给出:功能的实现思路(简单描述)、功能的创新点以及对于该功能能过解决的问题或者内容 +10
|
|
|
|
|
4.1.1 博客评分规则(70%)
|
|
|
|
|
1.(1.1)在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹,同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。**(2')**
|
|
|
|
|
|
|
|
|
|
请用以下列一级标题分割你的博客(冒号后的文字设置为一级标题)
|
|
|
|
|
|
|
|
|
|
——博客评分为半自动,如果没有按要求分割博客,造成评分出现问题,将不予处理
|
|
|
|
|
|
|
|
|
|
2.标题一:一、PSP表格
|
|
|
|
|
|
|
|
|
|
(2.1)在开始实现程序之前,在附录提供的PSP表格记录下你估计将在程序的各个模块的开发上耗费的时间。(3')
|
|
|
|
|
|
|
|
|
|
(2.2)在你实现完程序之后,在附录提供的PSP表格记录下你在程序的各个模块上实际花费的时间。(3')
|
|
|
|
|
|
|
|
|
|
3.标题二:二、任务要求的实现
|
|
|
|
|
|
|
|
|
|
(3.1)项目设计与技术栈。从阅读完题目到完成作业,这一次的任务被你拆分成了几个环节?你分别通过什么渠道、使用什么方式方法完成了各个环节?列出你完成本次任务所使用的技术栈。(5')
|
|
|
|
|
|
|
|
|
|
(3.2)爬虫与数据处理。说明业务逻辑,简述代码的设计过程(例如可介绍有几个类,几个函数,他们之间的关系),并对关键的函数或算法进行说明。(20')
|
|
|
|
|
|
|
|
|
|
(3.3)数据统计接口部分的性能改进。记录在数据统计接口的性能上所花费的时间,描述你改进的思路,并展示一张性能分析图(例如可通过VS /JProfiler的性能分析工具自动生成),并展示你程序中消耗最大的函数。(6')
|
|
|
|
|
|
|
|
|
|
(3.4)数据结论的可靠性。介绍结论的内容,以及通过什么数据以及何种判断方式得出此结论(6')
|
|
|
|
|
|
|
|
|
|
(3.5)数据可视化界面的展示。在博客中介绍数据可视化界面的组件和设计的思路。(15')
|
|
|
|
|
|
|
|
|
|
4.标题三:三、心得体会
|
|
|
|
|
|
|
|
|
|
(4.1)在这儿写下你完成本次作业的心得体会,当然,如果你还有想表达的东西但在上面两个板块没有体现,也可以写在这儿~(10')
|
|
|
|
|
|
|
|
|
|
4.1.2 代码评分规则(30%)
|
|
|
|
|
总分30分,程序评分是根据代码质量综合考量给出的评分,主要考察如下方面:
|
|
|
|
|
|
|
|
|
|
项目结构的完整性(单元测试、异常处理、模块设计是否满足低耦合的要求)(10')
|
|
|
|
|
|
|
|
|
|
代码的可读性(注释等)(10')
|
|
|
|
|
|
|
|
|
|
变量、函数、类命名的规范化(10')
|
|
|
|
|
|
|
|
|
|
4.2 扣分规则
|
|
|
|
|
作业截止后发布博文:作业截止24小时内补交在原分数上扣20分,24-48小时内扣40分,48-72小时内扣60分,以此类推扣到0分为止;
|
|
|
|
|
发布博文但未提交任务:24小时内补提交扣10分,24-48小时内扣20分,48-72小时内扣30分,以此类推扣到0分为止(请注意:本次作业开始,不会再在QQ课程群中提醒需要提交任务);
|
|
|
|
|
缺交:以上两项扣分规则仅适用于在作业截止之后、评测开始之前补提交的情况!作业截止后任意时间开始进行评测,评测开始的具体时间不会提前告知,评测开始时仍未发布博客或未提交任务均视为缺交,评为0分;
|
|
|
|
|
抄袭:后台检测到的不诚信行为评为0分。
|
|
|
|
|
Part·5 注意事项
|
|
|
|
|
撰写博文时,请在编辑区右上角选择【切换为MarkDown】,使用MarkDown语言撰写今后的博客文档;
|
|
|
|
|
将作业标题严格命名为2024软工K班个人编程任务,不要修改。
|
|
|
|
|
因时间不同可能导致B站视频排序出现变化,此变化无影响,保证爬取的弹幕来自综合排序前300的相关视频即可
|