第二次提交

master
xuan 5 months ago
parent 2ce9f8cb5d
commit 1b7246baa6

@ -90,5 +90,5 @@ class reptile:
return self.path
if __name__ == '__main__':
reptile = reptile('2024年巴黎运动会',300)
reptile = reptile('2024年巴黎运动会AI应用',300)
reptile.get_dataset()

@ -0,0 +1,61 @@
import jieba
import re
from sklearn.feature_extraction.text import CountVectorizer,TfidfTransformer
from gensim import corpora,models,similarities
def read_file(path):
'''
读取文件并存储到列表中
'''
with open(path,'r',encoding = 'utf-8') as f:
lines = f.readlines()
return lines
def analyse_vector_tfidf(analyse_path,test_path,userdict_path):
'''
抽取与AI相关较为强烈的弹幕
'''
#加载词库
# jieba.load_userdict(userdict_path)
stop_words = []
#将数据的全部分词保存在all_doc
all_lines = read_file(analyse_path)
all_doc = []
#与AI应用相关的文本数据
test_lines = read_file(test_path)
test_doc = []
#开始分词
#对需要分析的数据集开始分词
for line in all_lines:
#利用正则表达式去除中文标点
line = re.sub('[^\w\s]','',line)
token = [word for word in jieba.lcut(line.strip()) if word not in stop_words and len(word)>1]
all_doc.append(token)
#对AI应用相关的文本进行分词
for line in test_lines:
line = re.sub('[^\w\s]','',line)
token = [word for word in jieba.lcut(line.strip()) if word not in stop_words and len(word)>1]
if len(test_doc)==0:
test_doc = token
else:
test_doc += token
#制作词袋
dictionary = corpora.Dictionary(all_doc)
#制作语料库,即具有词频的词袋模型词语ID号词语频率
corpus = [dictionary.doc2bow(doc) for doc in all_doc]
test_doc_vec = [dictionary.doc2bow(test_doc)]
#每个词语的tfidf值
tfidf = models.TfidfModel(corpus)
#相似度Sim算法
sparse_matrix = similarities.SparseMatrixSimilarity(tfidf[corpus],num_features=len(dictionary.keys()))
sim = sparse_matrix[tfidf[test_doc_vec]][0]
sim = sorted(enumerate(sim),key= lambda item: item[1],reverse=True)
print(sim)
print(all_lines[sim[100][0]])
if __name__ == '__main__':
# analyse_vector_tfidf()
path = './关于b站视频2024年巴黎运动会AI应用的弹幕.txt'
test_path = './巴黎奥运会AI文本库.txt'
userdict_path = ''
analyse_vector_tfidf(path,test_path,userdict_path)

File diff suppressed because it is too large Load Diff

@ -0,0 +1,21 @@
赛事期间无论是硬件设备的智能化、场馆管理的高效化还是运动员训练的科学化等方面AI技术均大放异彩。科技已然成为推动奥林匹克运动前进的关键引擎。
阿里云AI驱动运算提供的AI技术在羽毛球、田径等20多个赛事项目的14个场馆设置了高清云直播、VR/AR 全景直播推出360度实时回看、3D运动员追踪、虚拟演播区、数字人主播等技术为观众带来身临其境的沉浸式观赛体验。
在乒乓球、射箭等比赛中上海广播电视台旗下上海东方传媒技术有限公司SMT联合商汤科技有限公司自主研发InnoMotion体育赛事AI产品实时追踪和分析乒乓球的轨迹、落点、速度、转速、转向等关键参数精准捕捉箭矢的飞行轨迹、距离和风速并通过3D动画、MR等技术呈现给观众为观众提供专业AI技战术分析。这也是奥运会历史上首次将AI技术应用于乒乓球和射箭赛事的国际公共信号制作。
巴黎奥运会上AI大模型全过程参与了运动员的比赛和训练评价。基于AI+大数据的分析能力AI辅助训练系统能精准评估运动员的训练状态和效果为教练团队提供科学依据并对训练计划进行动态调整确保训练的科学性和有效性。比如通过高速摄像头捕捉比赛和训练视频教练员能够对运动员的技术动作进行详细拆解和评估。
AI大模型还能识别对手的弱点和习惯帮助制定精准的比赛策略还可以根据伤病类型和个人康复数据为受伤的运动员制定个性化康复计划。此外利用这项技术还能分析运动员的生理数据和训练负荷提出个性化预防措施。
跳水名将全红婵、陈芋汐会运用百度AI跳水辅助训练系统进行训练能够实时分析运动员的动作细节提供精确的量化分析和指导帮助教练团队制定更加科学的训练计划让运动员在更短时间内实现技术突破。
为了帮助全球约11,000名拥有不同语言和文化背景的运动员在奥运比赛场地出入并遵守相关规定国际奥委会与英特尔合作开发了基于Athlete365平台的聊天机器人AthleteGPT。
这是一款基于英特尔至强处理器和Gaudi加速器的RAG解决方案。AthleteGPT支持普通话、英语、法语、西班牙语、俄语、阿拉伯语等六种语言不仅能够应答运动员的日常询问并进行互动同时将在运动员入住巴黎奥运村期间为其按需提供信息运动员可以通过它快速获取有关比赛场馆、开幕式直播、比赛规则及赞助商活动等各种信息从而能够专注于训练和比赛。
AthleteGPT能在海量信息中迅速找到所需内容并提供24小时不间断的服务。此举不仅提高了信息获取的效率也为运动员们创造了更友好的交流体验。对于未来的全球体育界而言这一应用预示着未来赛事服务模式展示如何通过AI力量为运动员创造更专注、更专业、更极致的竞技环境。
奥运会赛事种类丰富,对于评论员、解说员以及媒体记者来说,如何快速检索到准确的奥运赛事信息,从上百年的奥运历史中搜寻到匹配的信息,是奥运报道以及奥运解说中的痛点。
为此阿里国际自研Agent框架支持了首个奥运领域的大模型应用开放给国际奥组委官方解说员辅助各项赛事解说。这一AI应用能够快速对相应的数据库或文档进行查询搜索通过数学运算或复杂的推理回答解说员的具体问题为奥运赛事提供更高的专业性和趣味性支持。不仅提升赛事直播质量还为观众提供了更丰富、更精准的解说内容。
体操领域的AI“裁判”全名为裁判支持系统The Judging Support SystemJSS由日本富士通公司与国际体操联合会FIG合作开发。该系统能够利用四到八个精心摆放的高清摄像头捕捉运动员的动作计算运动员动作的难度分值它能够精准呈现运动员转动的角度等肉眼难以判断的细节。
AI“裁判”本身并不做出评判只有当体操运动员或教练员提出申诉又抑或裁判组内部出现争议时它才会派上用场。通过迅速提供相关的数据分析包括动作的完成度、难度系数、技术执行等关键指标为裁判的最终判断提供坚实的依据确保了评判的公正性和透明度。
在赛事安保方面AI技术的应用同样不容小觑。面对历届奥运会网络安全的严峻挑战巴黎奥运会组委会部署了一套先进智能防御系统被誉为奥运会“数字铠甲”。通过云计算技术和分布式云架构组委会能够灵活调配计算资源应对突发的大规模网络攻击。AI驱动的面部识别技术和行为分析系统在比赛中加强安保预防和应对潜在安全威胁。
AI还在优化观赛管理与彰显人性关怀方面作用显著。为了确保赛事顺利进行奥运会场馆后勤、观众引导、公众安全、人员配置及餐饮等关键服务必须无缝对接。利用AI数据收集系统主办方可以实时调整关键地点的后勤工作提升现场服务效率缩短现场服务等待时间实现奥运场地内的无缝导航并为未来的奥运会和残奥会规划保存统计数据。赛事期间该系统对巴黎、里尔等22个场馆实施了实时数据采集监测关键场馆空间和服务的使用情况。
网络空间的安全,同样重要。巴黎奥运会首次利用人工智能技术监控主要社交媒体平台,标记出具有网络暴力倾向的账号,为运动员提供安全的网络空间。
据国际奥委会评估为期16天的奥运期间社交媒体互动次数超过5亿次也带来了网络暴力、谣言、侮辱和威胁等多方面挑战不但可能在网络上导致争端及霸凌更是直接影响到运动员的身心健康、线下生活以及职业生涯规划。例如世界田联曾在2020年东京奥运会期间研究了运动员受到的网络暴力情况发现161个现役和退役运动员的推特账号中有23名受到针对性辱骂。今年8月4日新浪微博社区官方微博“微博管理员”发布公告指出不少网友在奥运乒乓赛事讨论中拉踩引战300余账号被禁言。
AI 系统全天候监控主要社交平台,包括 X原 Twitter、Instagram、Facebook 和 TikTok涵盖超过35种语言实时侦测并标记任何潜在的辱骂信息以便相关社交媒体平台处理甚至在运动员看到之前就将其拦截有效减轻了网络暴力带来的不良影响。
AI技术还被用于修复奥运会珍贵的历史影像。7月30日国际奥委会首次公布了1924巴黎奥运的珍贵影像采用阿里云AI技术将100年前的黑白影像修复为彩色高清影像纪念夏季奥运会时隔百年之后重返巴黎。观众们在影像中可以清晰感受到100年前奥运比赛的激烈场景。
修复后的历史影像清晰展现了100年前巴黎奥运会开幕式入场仪式。田径项目是赛事的焦点在AI云技术加持下观众可以欣赏彩色版1924年巴黎奥运会田径运动员惊人的力量、速度和耐力。
技术增强体验人性化让观赛体验得到了前所未有的提升运动员表现效果的最大化离不开AI辅助训练、可穿戴设备以及新材料和运动装备研发数据驱动体育的科学化为赛事运营管理和决策提供了强有力数据支持网络安全监控、面部识别技术、运动损伤预防和康复训练技术运用确保了赛事安全性和运动员健康。AI评分系统与运动追踪技术等前沿科技的应用标志着体育科技领域的新探索和创新实践……巴黎奥运会的AI应用也为未来的体育赛事提供先例引领智能化、数字化、个性化的赛事潮流激发体育事业的前进发展。
Loading…
Cancel
Save