点球成金!数据分析助业余门将变身德赫亚

莱恩·比尔在汉普郡担任半职业门将时,有很多事情必须自己弄清楚。如果前锋接到长传球形成了一对一单刀,他应该冲出去还是留在原地?伸展身体尝试封堵射门还是趴在地上堵住死角?其他球员有经验丰富的教练教他们如何在自己的位置上更好地踢球,但这个层级中的门将教练很少。
数据也没有多大帮助。攻读博士学位的时候,比尔开始研究足球分析,现在他在相关领域的两家初创公司AI Abacus和Sentient Sports工作。但身为一名学生,他得到的事件数据只记录了带球动作和球员在球场上的位置,没有研究技术所需的身体动作细节。
如果想要了解非常细节的信息,就必须自己想办法收集。
几年前剑桥大学有一位对数据充满好奇的门将约翰·哈里森,他决定开展研究。他先仔细研究了录像,记录了英超门将在每次一对一情况下的表现。这是一项艰巨的工作,他不得不在改变记录后重新收集整个赛季的数据。但这也给了他一个独特的视角,让他了解到许多经验老道的教练也想知道的问题。
“我记得大概五年前,这一领域还是人人皆可涉足的沃土。”哈里森说:“英格兰的一位门将教练联系了我,他对有用的工作很感兴趣。教练们可能会说,‘覆盖这里,在这里伸展,在这里封堵’,但他们说的都不一样。当时他说,‘如果英超联赛的数据能告诉我们应该在什么时候使用什么动作,那就太棒了。’”
2020年哈里森在推特上公布了他的成果。在球门柱到点球点的中间区域,门将最有可能冲向前锋,将双臂和双腿摆成X形,以这种方式挡出单刀。哈里森称这种姿势为“主动出击并舒展身体”。想象一下,就像拜仁慕尼黑的诺伊尔双腿岔开的样子。
哈里森的模型显示,距离球门的范围越大,前锋的射门角度越窄,因此门将应该“主动出击并进行封堵”。他们应该一条腿膝盖向上,另一条腿向下,避免遭遇穿裆,同时手臂放低。哈里森说,德赫亚非常擅长这种动作,但这些年来他的技术一直不太稳定。
而在距离球门14码远的地方,哈里森发现最好的策略是在原地观察射门。这样门将可以有更多的时间对前锋的移动做出反应,或者在理想情况下,让后卫也跟上。另一种常见的一对一动作是“主动出击和做出反应”,门将扑向前锋的方向,身体保持直立,但似乎不是最好的选择。
过去的几年里,哈里森的数据已经扩展到了近5000个一对一的“情况”,但他的最佳策略模型仍然没有改变。不止是射门,有时候门将会阻止这种情况出现。
由于收集到了大量的人工数据,哈里森得以观察球员的技术,这在足球分析中十分罕见,但也有其局限性,最首当其冲的是单人工作很难量化。经过多年的训练,周日晚上哈里森可以在几个小时内完成整个周末的英超联赛门将分析,但如果再加入其他联赛,需要的时间就不止一天了。
这些数据也相当主观,哈里森担心自己对个别门将更加了解,从而影响数据的准确性。而且数据只详细记录了门将尝试使用的技术动作,而非他们如何执行这些技术。
而这,就是计算机视觉分析可能会派上用场的地方。
最近南安普顿大学一位名叫马修·威尔的研究生给比尔带来了灵感。如果他们在一对一的情况下研究门将本身,让计算机对射门技术进行分类,结果会如何?
他们需要使用利用图像检测身体姿势的软件,在足球数据分析中,这是一个很有前途但很复杂的新领域。比尔说:“威尔在一个硕士课程中了解到了这件事,他很想将其应用到门将分析中。计算机视觉分析对我是一个全新的概念,但分析这些数据真的很有趣。”
项目的第一步是从StatsBomb事件数据中识别出一对一的射门,然后从视频中剪辑出射门图像。威尔、比尔和其他同事一起,将2018年世界杯、2017-18赛季和2018-19赛季的323次射门影像输入软件,从而捕捉门将四肢和关节的位置。
与哈里森不同,南安普顿大学的研究小组并没有对身体姿势进行分类。相反,他们利用一种聚合算法将简单的数字形象分成四组,称之为“主动组”、“被动组”、“伸展组”和“封堵组”。
最后,威尔团队根据门将的位置及后卫是否在身后施压,建模分析了四组球员中的哪一组在不同的一对一情况下表现得最好。
南安普顿大学的研究小组或多或少沿用了哈里森的研究,改用了不同的方法,用机器学习代替了劳动密集人类判断。两种方式都得出了类似的指南,指导门将应如何面对一对一的情况,令人更加放心。
两种模型都发现,最好的方式是保持被动状态,在中距离的环境中应对前锋,而且他们发现,一般来说最好的方式是在靠近球门的中心区域进行掩护。
在点球点附近,如果一名后卫紧跟在前锋身后,南安普顿模型的推荐值就会从“封堵型”变为“被动型”。比尔解释道:“如果前锋受到来自背后的压力,他们更有可能选择提前射门。如果他们没有感到压力,则更有可能带球靠近禁区,选择绕过门将。这就是两者之间的区别。”
本月举行的斯隆体育分析大会上,威尔和比尔展示了南安普顿大学团队的研究成果。斯隆体育分析大会是全世界最引人注目的体育爱好者年度盛会之一,比尔谦虚地谈到了这项工作的应用前景,可以帮助像他一样的低级门将向顶级门将学习。
斯隆体育分析大会上的完整报告包括了模型最常用的技术推荐的球员排名,其中前卡迪夫城门将尼尔·埃斯里奇的入选令人意外,最优率达到65%。但比尔认为,研究应该为专业人士的判断提供证据,并不是要取代他们做出判断。例如“一些非标准化的技术,如卡斯帕·舒梅切尔的海星式技术,在我们的模型判断中可能不是最优选择”,比尔在一封电子邮件中写道,这些相同的技术“对个体非常奏效”。
看完整整四个赛季的录像后,哈里森对自己的判断信心十足。他说:“只要在近距离内,舒梅切尔就伸展身体,完成了很多次中路一对一扑救,但远距离的时候他常常被穿裆。观察他能否调整自己的技术动作,尝试完成封堵或者更远距离的封盖,可能会很有意思。”
如果球员技术研究能发挥作用,可以有更多数据帮助球员进步。过去的10年里,棒球击球手和篮球投手根据分析调整了机制。但迄今为止由于数据的简单性和比赛的复杂性,足球运动并未受到这一趋势影响。但身体姿势数据变得更精确、更广泛,这种情况可能会发生改变。
获得球员技术的研究数据仅仅是一个开始,更难的是让球员和教练相信数据模型可以帮助他们。
比尔说:“这一直是我想让教练理解的地方。数据分析可以让教练更容易做出决定,让他们有更多的考量。我并不是想在培养一个自动化的门将教练。”