数据浪潮中的 NFL:以AI重塑美式橄榄球的智慧之旅 | 品牌
一名球队成员为了获得荣耀,需要奔跑多远的距离?
在篮球中,从己方底线到对方罚球线,距离约为20米,运球跑动时间约为3~4秒。
在足球中,从己方后场突入对方禁区,距离约为50米,通常需要带球7~8秒。
而还有一种运动,球员破坏对方进攻并拿到球后,从己方端区奔跑至对方端区并达阵得分(touchdown),其奔跑距离可能超过100米。在长达十数秒的奔跑过程中,他将灵活摆脱对方防守队员的拉扯、飞扑或滑铲,在观众们经久不绝的欢呼声中抵达终点,将全场气氛推至高潮。
这项运动就是美式橄榄球。
站在智能化变革的前沿
美式橄榄球是一项融合了身体对抗、策略执行和团队配合的运动,在美国等多个国家、地区拥有极高人气与热度,美国职业橄榄球联盟(NFL)也因此成为全球最具商业价值的体育联盟之一,其每年最具影响力的赛事“超级碗”(Super Bowl)吸引着全球观众的关注。2023年,NFL总收入约为202亿美元,旗下达拉斯牛仔队曾拥有80亿美元估值,是全球估值最高的体育球队。
图片来源:NFL官方网站
广受欢迎背后的主要原因,是美式橄榄球自身的独特风格。这项运动的规则决定了球员必须同时具备速度、力量和爆发力,且频繁以高强度进行相互冲撞或擒抱,场上的每一轮进攻往往会在十数秒甚至是数秒时间内完成,使得比赛节奏非常快、对抗性极强。此外,美式橄榄球场地大、球员数量多,一支球队在赛季中可拥有53名球员且比赛时换人没有次数限制,导致战术复杂度高、变化快,反过来又增添了比赛的观赏性,为运动的传播和普及奠定了坚实基础。
然而另一方面,也正是由于参赛球员多、战术体系复杂,自1869年规则初步确立以来,比赛的节奏与风格一直在变化。例如,最初以跑动为核心的进攻战术数据不佳,在十九世纪初二十年代,有三分之二的美式橄榄球比赛以双方比分0:0收场,促成了更为激进、观赏性更强的传球战术以及历史上著名的“T阵型”。而随着数据挖掘程度的进一步加深,球队中的四分卫又从单一的传球指挥者进化成为既能传也能跑的多面手,“空中进攻”等战术也逐渐成为今天的主流。如今,NFL在每场比赛过程中均会对推进码数、传球次数、擒抱次数、冲击压力等数据进行充分统计、分析与评估,并以此结果驱动赛程、赛制以及比赛规则的变化。
然而,这就意味着需要针对美式橄榄球赛场上的22位球员,每秒基于位置、速度、加速度等关键运动信息采样10次,一场比赛中可能涉及的数据要以百万为单位来计算。以往手工统计的方式不仅无法精确分析动作过程中追击路径、反应速度、决策过程等细节内容,同时限于计算能力,数据的统计与分析只能在赛后完成,仅能为球队提供未来技战术指导,而无法帮助调整当前比赛的即时策略。
值此AI技术浪潮方兴未艾之际,借助性能强大的AI进行更高效处理数据成为了NFL当仁不让的选择。但是,首先要回答一个问题,处理的方向是什么?
在生成式AI视角下,看到全新的赛场
压力概率模型(Pressure Probability)
美式橄榄球是攻防的艺术,攻击方的所有策略都是为了突破防守方防线,将球尽可能推进得更远。为了更好地衡量推进的可能性,NFL旗下的次世代数据团队(Next Gen Stats,NGS)与亚马逊云科技共同开发了基于机器学习的“压力”(Pressure Probability)模型,让攻方对进攻过程中可能受到的阻力了然于心。
压力模型以时间为维度,表征阻止进攻的可能性,即压力大小(图片来源:https://www.nfl.com/news/next-gen-stats-introduction-to-pressure-probability)
“美式橄榄球赛场上双方共计有22名球员,其中许多人无时无刻不在跑动,如何判断哪些跑动球员是有进攻意图的,哪些是在防守,以及哪些是在干扰对方?”
“当一名球员正在跑动时,如何判断他的目标角色究竟是谁?”
“如果跑动者的目标是攻方的四分卫(通常总是持球进攻的关键角色),他成功拦截进攻的几率是多大?”
“如果同时有多名跑动者意图堵截四分卫,则进攻的整体成功率又是多大?”
上述问题与成功进攻的可能性息息相关,而压力模型的出现正是为了回答这些问题。该模型由NFL以往比赛中超过90000个回合的数据训练而来,基于亚马逊云科技提供的图形神经网络模型(graphic neural network model,GNN)技术,可准确判断哪些跑动是为了进行封堵,而哪些只是单纯在追赶。
在此基础上,模型将以十分之一秒为单位,计量防守球员对进攻方持球者所造成的“压力”,为攻防双方提供战术优化空间。需要几个人封堵?从哪些角度进行封堵、成功率更高?什么动作能降低防守方造成的压力?这些原来只能靠经验以及天马行空般想象力制定出的战术与策略,从此得到了数据支撑。
图片来源:NFL官方网站https://nextgenstats.nfl.com/
通过将压力模型细化,球队还能够从比赛数据中获取进一步的洞察:
• 数据显示,当一名四分卫持球时,平均而言压力会在2.9秒内出现,如何利用好这个时间窗口指挥球队散开阵型?假设球员在一秒内能移动4~6米,2.9秒后队伍能分散到什么程度,四分卫如何基于这一分布展开进攻?
• 数据显示,突击手在所有比赛中,针对攻击方四分卫的平均压力给到率为10.3%,而当前球队数值却显著低于该值。如何调整人员,以便对攻方形成更大压力?
• 数据显示,在整个赛季中突击手通过施加压力,最终获得正向结果(成功擒杀、或是迫使四分卫改变战术动作)的几率约为54%,但对手的过往成绩仅为46%。这意味着他们拥有一个非常灵活与狡猾的四分卫,此时我方又应如何应对?
种种战术与策略空间,在亚马逊云科技所打造的土壤上疯狂生长。压力概率模型提供了对进攻与拦截的更全面评估,重新定义了橄榄球分析的极限,令球迷、分析师以及教练和球员能够更深入地了解比赛、欣赏比赛以及享受比赛。
而这还只是刚刚开始。
擒抱概率模型(Tackle Probability)
仅仅对防守方可能造成的压力进行分析,不过是触碰到了冰山一角。NFL的每场比赛中,平均一方球队会进攻数百次,为了遏止进攻,防守方最有效、同时也是最常见的动作是“擒抱”(Tackle),即以规则允许的合法身体接触,抱住进攻球员的腿部、腰部等部位,使其停止前进、摔倒在地或失去对球的控制。事实上,防守方实施压力的最终目的,正是以擒抱阻止攻方带球推进。考虑到大多数情况下进攻总是以攻方球员被擒抱为结束,一场比赛中的擒抱行为可能会出现几百次。掌握擒抱,就等于掌握了比赛。
一个成功的擒抱动作 (图片来源:亚马逊云科技官方Youtube频道)
“美式橄榄球是一项关于封堵和擒抱的运动,如果你既不能封堵也不能擒抱,那么你就会输。”
——NFL Next Gen Stats研究分析经理Keegan Abdoo
问题的难点在于,判断压力更多是从双方的位置、朝向以及当前速度入手,而擒抱的成功率却涉及更多因素如体型&力量对比、球员近期状态,其复杂程度要远远超过压力分析。“擒抱模型”概念最早在NFL与亚马逊云科技联合举办的“大数据超级碗”(Big Data Bowl)—— 一项每年举办的以数据分析为橄榄球运动提供支持的比赛中被提出,试图以机器学习方式,借助实时数据判断实施擒抱的成功率。然而,自2018年以来的所有NFL比赛,其数据量是大数据超级碗的近20倍,如何在不牺牲速度或准确性的前提下,高效处理和分析如此庞大的数据集?
NGS再度与亚马逊云科技展开了合作,使用生成式AI工具Amazon SageMaker开发能够应用于NFL全赛季数据的擒抱模型。
在亚马逊云科技强大基础设施的支持下,Amazon SageMaker能够通过灵活扩展计算资源,应对不断增加的数据量。另一方面,经验丰富的亚马逊云科技工程师们使用特征工程方法,从众多数据中筛选、识别出可以提升模型预测能力的部分,从而在不降低分析精度前提下,大幅度减少所需要分析的数据量。为此,团队通过分析比赛录像及咨询NGS数据分析师,确定了20个模型所使用的特征,其中14个为亚马逊云科技团队全新开发。
最终,双方联合打造了基于Amazon SageMaker的数据分析框架。NGS可轻松地对该框架执行特征添加或移除操作,探索、记录不同的模型架构和参数,并在几分钟内部署至生产环境的容器中,从而简化了从研究到生产的路径。
基于Amazon SageMaker Ground Truth开发的自定义用户界面,允许分析师直观地审查比赛录像 (图片来源:https://aws.amazon.com/cn/blogs/media/a-new-take-on-tackling-nfl-next-gen-stats-and-aws-bring-data-to-the-gridiron/ )
当模型特征不断优化并日益复杂时,团队又面临着另一个挑战:如何高效地测试和验证模型?由于涉及数百万个数据点,使用传统方法进行预测可能需要数周时间。亚马逊云科技团队使用了Amazon SageMaker批处理转换功能,将整个NFL赛季中所有比赛、共计1500万条内容的预测时间,从一个月压缩到一小时。这一突破从根本上改变了对模型进行评估和优化的方式,不仅令测试效率大幅提升,同时也消除了潜在的抽样偏差可能。此外,该项目还使用Amazon SageMaker Ground Truth开发了自定义用户界面,允许分析师直观地审查比赛录像、查看擒抱概率分析与实际比赛的吻合程度,为模型后续优化提供了可能。
在亚马逊云科技团队云计算和AI专业能力,以及NGS分析师深厚橄榄球知识的结合之下,擒抱模型已成为当前NFL比赛分析的重要工具。这不仅仅代表一个新的统计数据,更象征了创新工程与深厚领域专业知识的结合,意味着体育和技术的交汇将继续推动可能性的边界,从场内拓展至场外,为球迷、教练和球员提供全新的方式来理解和欣赏他们所热爱的比赛。
譬如说,更佳的观赛体验。
让数据在赛场之外发挥威力
所有球迷都希望看到尽可能多的精彩比赛。然而,NFL的赛程编排属于数学上的NP完全问题(世界七大数学难题之一:多项式复杂程度的非确定性问题),赛季将持续18周、合计272场比赛覆盖了576个可能的时段,要制定出同时兼顾参赛队伍实力、状态,以及球迷观看的便利性、收视率,甚至是相关广告与赞助等多方因素的完美赛程,似乎是一项“不可能的任务”。
“创建赛程,这肯定涉及到艺术与科学的结合。”——NFL广播主管Charlotte Carey
在过去15年中,NFL的赛程安排一直依靠堆砌大量人力计算,一开始工作人员们甚至需要在软木板上以手动画图方式进行编排,有时经历一整晚时间依然一无所获。所幸,亚马逊云科技改变了这一切。在亚马逊云科技弹性云计算Amazon EC2的支持下,NFL能够同时模拟数千个赛程场景,并寻找其中最为优秀者。
任何一场比赛的变化,都意味着全新的赛程安排 (图片来源:https://aws.amazon.com/cn/sports/nfl/schedule/)
赛程安排要同时考虑球队出行、观赛黄金时段、对抗激烈程度、场馆安排、健康及安全等多方因素,整个系统中的规则数量超过2万条。每晚,成千上万的Amazon EC2实例将以基于这些规则,以分布式计算方式搜索各种可能,寻找能平衡32支NFL球队、7个电视网络合作伙伴和数百万NFL铁杆球迷需求的赛程。变化无所不在,球员转会或是退役的情况时有发生,而明星球员的转会完全有可能改变一支球队的命运,甚至是改变整个联赛的形势。Amazon EC2的按需扩展、自动伸缩特性,在变化出现时可自动扩展计算规模,使得赛程即时调整成为可能,为球迷带来更精彩的每一场比赛。
与此同时,作为一种灵活的使用方式,Spot实例让NFL获得了更高性价比。由于使用空闲EC2容量,Spot实例的价格相较按需使用实例低90%。而亚马逊云科技推出的Spot评分等功能,让NFL能够更好地识别获取Spot实例的可能性,获得更多及更平稳的可用容量。此外,亚马逊云科技还拥有多种灵活的实例集分配策略,令NFL可根据需要使用特定Spot池,最大限度防止实例应用中断。
如今,NFL通过4000个Amazon EC2实例,每晚运行数千个赛程模拟并实时得出最新赛程调整结果。由于使用Spot实例,NFL在得以获取最优赛程解法的同时,每个赛季节省了200万美元。
改变游戏规则,让更多数据人才进入橄榄球领域
数据分析能力帮助NFL更准确地分析与认识比赛,并做出更理想赛程安排。那么,其他人能够从数据分析中得到什么?
答案是,面向未来的机会。
大数据超级碗比赛汇聚了来自75个不同国家与地区的参赛者,自2019年以来规模已扩大了4倍(图片来源:https://aws.amazon.com/cn/sports/nfl/big-data-bowl/)
NFL和亚马逊云科技携手打造的“大数据超级碗”比赛,让更多才华横溢的分析师得以进入这个领域,并最终改变了美式橄榄球本身。在大数据超级碗中,参赛者们基于美式橄榄球比赛中进攻、防守或是特殊等位置可能涉及的分析选项做出自己的大胆猜测,而许多这样的猜测最终都成为了NFL进一步提升数据分析能力的基础。
例如,使用篮球和足球中知名的空间支配算法以准确衡量球员在球场上的影响能力,或是将预期前进码数纳入传球冲刺指标中、从而对进攻形成更为立体化的评价。基于大数据超级碗中某个围绕特殊位置球员所提出的阻挡指标参数,甚至诞生了一篇关于边锋如何转身对抗球员的论文。
为了帮助参赛者们更好地实现目的,亚马逊云科技提供了生成式AI和机器学习方面的专业知识支持,帮助参赛者们快速上手运用他们在传统体育项目中未曾接触过的知识和技术。由于所有算法以及代码均存储在亚马逊云科技上,任何人都无需从头构建分析系统,而是能够直接上手应用。他们所得出的结论,反过来也为NFL带来了大量干净、已标记、高质量的数据,让NFL能够基于这些数据去进行更为深入与细致的研究。
大数据超级碗迄今已举办了七届,仅在前四届比赛中,就有50多名参赛者因骄人的成绩而进入到美式橄榄球行业中,成为职业体育工作者,其中更包括30多名运动员。大数据超级碗在让NFL运营更精细化的同时,还为更多人开辟了进入职业体育行业的新通道,展示了数据分析在体育行业中的巨大价值。
结束语
NFL与亚马逊云科技的合作,见证了AI等智能化技术为体育行业带来的改变。从赛场上的压力概率模型、擒抱概率模型,到赛程编排的智能化变革,再到大数据超级碗带来的行业新鲜血液,一系列创新不仅重塑了美式橄榄球的比赛模式、提升了球队的竞技水平和决策效率,也为球迷带来了前所未有的观赛体验。
未来,相信这种智能化变革将继续在体育行业中发挥深远影响,激励更多的联盟和赛事拥抱技术,共同探索数据与体育结合的无限可能,为业内人士及体育爱好者描绘出更为波澜壮阔的未来。
*前述特定亚马逊云科技生成式人工智能相关的服务仅在亚马逊云科技海外区域可用,亚马逊云科技中国仅为帮助您发展海外业务和/或了解行业前沿技术选择推荐该服务。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。