Add 题目描述

main
pux36pf8t 3 months ago
parent d75a56054f
commit 91e03b332f

@ -0,0 +1,93 @@
Part·1 任务背景
2024年第三十三届夏季奥林匹克运动会2024 Summer Olympics一般称为2024巴黎奥运会Paris 2024于2024年7月26日至8月11日在法国巴黎举行此次为法国相隔100年后再次举办夏季奥运会。巴黎成为继英国伦敦后第二个三度举办夏季奥运会的城市前两次分别在1900年及1924年举办。最终美国代表团以40枚金牌、126枚奖牌坐拥奖牌榜首位中国代表团以40枚金牌、91枚奖牌排名第二东道主法国代表团则拿下16枚金牌、64枚奖牌位列第五。本届是现代夏季奥运会历史以来第二次有多于一个国家的代表团美国和中国获得最多且同样数量的金牌。
2024巴黎奥运会这场体育盛宴不仅承载着运动员的汗水与梦想更是工业数字化浪潮的壮阔展示。在这场跨越国界的竞技中数字科技如同隐形的魔术师悄然编织着赛事的每一个细节从幕后到台前从组织策划到观众体验全方位塑造着奥运会的面貌让我们见证了一个科技与体育深度融合的新时代。
本次作业要求实现2024巴黎奥运会视频弹幕分析使用爬虫在B站爬取相关视频弹幕并给出数量排名前8项关于本次赛事应用AI技术的弹幕同时所有数据进行词云可视化分析最后通过统计得出关于2024巴黎奥运会利用AI技术的相关结论。
Part·2 任务要求
2.1 数据获取
利用爬虫B站爬取所需弹幕数据搜索关键词“2024巴黎奥运会”爬取综合排序前300的所有视频弹幕。
2.2 数据统计
统计AI技术应该方面的每种弹幕数量并输出数量排名前8的弹幕。
将统计的数据利用编程工具或开发包自动写入Excel表中。
2.3 数据可视化
对采集的数据集进行可视化表示,制作词云图,越美观越好。
2.4 数据结论
通过统计数据得出当前B站用户对于2024巴黎奥运会应用AI技术的主流看法。
2.5 附加题
爬取世界主流媒体的观点,预测事件走向。
自主发挥:爬取有趣的数据进行分析、制作数据可视化大屏等,有创意有乐趣即可。
Part·3 编码要求
在头歌平台https://code.educoder.net/projects中新建一个**学号为名**的文件夹。
在开始实现程序之前在PSP表格[附录1]记录下你估计在程序开发各个步骤上耗费的时间在你实现程序之后在PSP表格记录下你在程序的各个模块上实际花费的时间。
使用C++、Java或者Python3实现提交python代码时请附带上requirements.txt。请使用Visual Studio Code进行开发。对于C++/Java还需将编译好的程序发布到https://code.educoder.net/projects仓库中的releases中。
提交的代码尽可能经过Code Quality Analysis工具的分析并消除所有的警告。
完成项目的首个版本之后请使用性能分析工具例如Studio Profiling Tools来找出代码中的性能瓶颈并进行改进。
使用https://code.educoder.net/projects来管理源代码和测试用例**代码有进展即签入https://code.educoder.net/projects**。签入记录不合理的项目可能会被询问项目细节。
使用单元测试[附录3]对项目进行测试,并使用插件查看测试分支覆盖率等指标。
Git代码管理方法学习可参考https://www.educoder.net/paths/41
Part·4 评分细则
4.1 得分表
评分点 描述 得分
1.1 在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。 2
2.1 在开始实现程序之前用附录提供的PSP表格记录下在各个模块上开发的预估耗时 3
2.2 在完成程序之后用附录提供的PSP表格记录下在各个模块上开发的实际耗时 3
3.1 项目设计与技术栈 5
3.2 爬虫与数据处理 20
3.3 数据统计接口部分的性能改进 6
3.4 数据结论的可靠性 6
3.5 数据可视化界面的展示 15
4.1 完成作业过程中的心得体会。 10
5.1 项目结构的完整性(单元测试、异常处理、模块设计是否满足低耦合的要求) 10
5.2 代码的可读性(注释等) 10
5.3 变量、函数、类命名的规范化 10
6.1 附加题:能否正确爬取世界主流媒体的观点,预测事件的概率性走向。 +10
6.2 附加题:除了任务要求三点外的,自行实现其他与题目相关的创新功能与内容。在博客中给出:功能的实现思路(简单描述)、功能的创新点以及对于该功能能过解决的问题或者内容 +10
4.1.1 博客评分规则70%
1.(1.1)在https://code.educoder.net/projects仓库中新建一个学号为名的文件夹同时在**博客正文首行**给出作业https://code.educoder.net/projects链接。**2'**
请用以下列一级标题分割你的博客(冒号后的文字设置为一级标题)
——博客评分为半自动,如果没有按要求分割博客,造成评分出现问题,将不予处理
2.标题一一、PSP表格
(2.1)在开始实现程序之前在附录提供的PSP表格记录下你估计将在程序的各个模块的开发上耗费的时间。3'
(2.2)在你实现完程序之后在附录提供的PSP表格记录下你在程序的各个模块上实际花费的时间。3'
3.标题二:二、任务要求的实现
(3.1)项目设计与技术栈。从阅读完题目到完成作业这一次的任务被你拆分成了几个环节你分别通过什么渠道、使用什么方式方法完成了各个环节列出你完成本次任务所使用的技术栈。5'
(3.2)爬虫与数据处理。说明业务逻辑简述代码的设计过程例如可介绍有几个类几个函数他们之间的关系并对关键的函数或算法进行说明。20'
(3.3)数据统计接口部分的性能改进。记录在数据统计接口的性能上所花费的时间描述你改进的思路并展示一张性能分析图例如可通过VS /JProfiler的性能分析工具自动生成并展示你程序中消耗最大的函数。6'
(3.4)数据结论的可靠性。介绍结论的内容以及通过什么数据以及何种判断方式得出此结论6'
(3.5)数据可视化界面的展示。在博客中介绍数据可视化界面的组件和设计的思路。15'
4.标题三:三、心得体会
(4.1)在这儿写下你完成本次作业的心得体会,当然,如果你还有想表达的东西但在上面两个板块没有体现,也可以写在这儿~10'
4.1.2 代码评分规则30%
总分30分程序评分是根据代码质量综合考量给出的评分主要考察如下方面
项目结构的完整性单元测试、异常处理、模块设计是否满足低耦合的要求10'
代码的可读性注释等10'
变量、函数、类命名的规范化10'
4.2 扣分规则
作业截止后发布博文作业截止24小时内补交在原分数上扣20分24-48小时内扣40分48-72小时内扣60分以此类推扣到0分为止
发布博文但未提交任务24小时内补提交扣10分24-48小时内扣20分48-72小时内扣30分以此类推扣到0分为止请注意本次作业开始不会再在QQ课程群中提醒需要提交任务
缺交以上两项扣分规则仅适用于在作业截止之后、评测开始之前补提交的情况作业截止后任意时间开始进行评测评测开始的具体时间不会提前告知评测开始时仍未发布博客或未提交任务均视为缺交评为0分
抄袭后台检测到的不诚信行为评为0分。
Part·5 注意事项
撰写博文时请在编辑区右上角选择【切换为MarkDown】使用MarkDown语言撰写今后的博客文档
将作业标题严格命名为2024软工K班个人编程任务不要修改。
因时间不同可能导致B站视频排序出现变化此变化无影响保证爬取的弹幕来自综合排序前300的相关视频即可
Loading…
Cancel
Save