足球拥抱大数据之下篇:能帮你省钱,能帮你赢球

中东游侠

上篇回顾:【足球拥抱大数据之上篇:球探和数据,两手都要抓】

“金牌球探”也是数据狂人

在克里斯多夫-比尔曼的著作《足球黑客》里,他详细叙述了前多特蒙德首席球探米斯林塔特的成功模式,后者曾为大黄蜂签下了莱万多夫斯基、香川真司和奥巴梅扬。多特蒙德当时只有10名球探,这个规模对于一支欧洲顶级强队来说简直是袖珍级的,但他们的工作效率却令人钦服。2017年,阿森纳为了挖角米斯林塔特付出了100万欧元的代价。比尔曼写到,米斯林塔特的团队每年向多特蒙德递交的转会潜在目标人数达到了2500人,他们需要用最快的速度挑选出最适合球队的几名球员。一些顶级球队设立了自己的数学分析模型,并建立了自己的数据分析办公室,但大多数球队还是求助于Analytics FC和SciSports。

(图)米斯林塔特

在马德里一家酒店的大厅里,一位20多岁的年轻人正在来回踱步。他来自德国,为人风趣幽默,年纪轻轻却拥有多个经济学和管理学硕士学位,但他并不是一个书呆子,而是一个非常雄辩的销售人员。他叫西蒙-罗德尔,是SciSports公司奥地利、德国和瑞士三个国家的负责人。Transfer Room正在这家酒店举办活动,这是一个旨在让两家球队直接沟通球员的转会的线上软件,他们的目的是尽可能减少经纪人对球员转会的干预。活动现场会有超过150家俱乐部的代表到场,罗德尔需要一个一个地和他们进行接触,争取把自己的公司推介到欧洲顶级球队层面。

我们坐了下来,他拿出了笔记本电脑,向我们展示了他的软件。罗德尔说:“我们与50多支球队有商务往来,包括里昂、阿贾克斯和比利时国家队。我自己又为巴塞尔、法兰克福、沃尔夫斯堡和帕德博恩工作。

“帕德博恩的总经理说他们取得的成绩大部分都是SciSports的功劳。他们在德丙时开始和我们合作,当时他们几乎没有什么转会预算,但这支球队比他们同级别的对手更聪明,所以他们能从丙级一路升上甲级。看看他们的球员吧,很多都来自足球欠发达地区,就凭他们那单薄的球探网络根本覆盖不到那些地区。”

那他们是怎么做到的呢?“我们先收集数据,比如英格兰的前六个级别联赛,德国的前四个级别联赛以及巴西的前四个级别联赛。但凡在名单中的球员,我们都会追踪并实时更新数据。我们的计算模型会一直追踪这名球员并显示他对球队的影响。我们和WyScout合作得到视频资料,然后将数据进行加工,最后把简化过的信息提交给俱乐部。比如你是一支德乙球队,并打算找到一名以莱万为模板的前锋,我们会在模型中显示其现阶段能力并预测其未来潜力,同时回顾这名球员在过去6个月的表现。

“其实这就像是一个初步筛选的过程。这个过程之后,你可以派出球探进行实地考察,这就是所谓的精准打击,效率高,效果好。“

作为试验,我现场让他用计算模型找出几名类似莱万的球员。搜索过程非常迅速,而且我们还能加上更多的过滤参数。“米利克、多尔贝格、吉鲁和威尔逊是最终的结果,”他指着屏幕说道。其中威尔逊最引人注目,这位伯恩茅斯的前锋时常和切尔西和曼联联系在一起,很多人对此感到不可理解,但数据分析表明威尔逊是个非常有才华的球员。

说起搜索球员,有人会问球队为什么不去游戏《足球经理》里找球员呢?就算购买正版游戏也没几个钱。SciSports创始人布鲁维尔说确实有一些球队这么做。他说:“很多球队都会参考《足球经理》,但是《足球经理》和《FIFA》里的数据都来自业余观察员,而且他们都免不了会有一些主观倾向,大部分人都会偏向本国球员,但我们的数据都是客观的。”

罗德尔补充道:“而且就比赛本身来说,游戏的数据并非实时数据。他们每个联赛设置一个工作组,由工作组为球员的能力进行评定。我们就不一样了,我们有人工智能系统,人工智能系统会对来自全世界的比赛视频进行多达1000次的分析。这意味着人工智能系统得出的数据既准确又有极强的时效性。”

使用这套系统的不仅仅是帕德博恩这样的球队,还包括一些顶级球队。比如阿森纳以坎特为模板从桑普多利亚签下了托雷拉。

阿森纳在2012年以210万英镑的价格从美国数据公司StatDNA买下了一套属于自己的数据系统。比尔曼在《足球黑客》里写道:“阿森纳的保密工作做得非常好,甚至在阿森纳每年的财报上都找不到这家美国公司的全称,只有由首字母缩略词组成的:AOH-USA LLC。”

阿森纳的运营总监阿尔姆施塔特很快由幕后走向了前台。阿尔姆施塔特曾就读于伦敦政经学院并在高盛工作了三年,并且是哈佛商学院的工商管理硕士。他告诉阿森纳CEO加齐迪斯:“看一个球队阵容就像看一组证券组合,这里面包含30个价值不等的资产项目”。

阿尔姆施塔特的任务是在转会和工资支出两方面提高效率。阿尔姆施塔特表示如果先前就使用StatDNA的数据,阿森纳便不会在沙马赫和朴主永身上浪费大把的转会资金。比尔曼写道:“数据显示,早在为波尔多效力时,沙马赫的期望进球值就比较低,因为他总是在不恰当的位置起脚射门。系统还表明,严重的技术缺陷让沙马赫在运动战中的贡献也相当有限。”最终温格被说服,并同意从StatDNA引进这套系统。

(图)“制造帝”沙马赫在阿森纳没有达到预期

可以预见到的是,在不久的将来,将还会有越来越多的顶级球队建立自己的数据分析模型。SciSport的罗德尔说:“有一些球队正在建立自己的数据系统。属于自己的系统一定更契合俱乐部的实际需求。比如说我们可以定义出一名典型的左边后卫,但是RB莱比锡非常清楚自己需要的左边后卫是什么样子。一些大俱乐部有时候会拒绝我们的服务,因为能入他们法眼的球员少之又少,光用眼就够了。就在这里,我刚和尤文图斯的代表见了面,虽然他邀请我去都灵做客,但我能看出来,他们对是否有必要和我们合作持怀疑态度,他们是意甲老大,买成名球员是其一贯做法。”

现在的俱乐部无论大小,逐渐接受了数据与直觉双管齐下的方案。布鲁维尔说:“数据已经证明了可以帮助人们节省成本。过去,电脑科学从业人员可能也认为和老派的足球人完全没法沟通,但没有合作的话是什么都办不好的。现在不一样了,我们需要所有人通力合作才能打造一些美妙的项目,而不是闭门造车。直觉和数据。两者缺一不可。”

斯蒂尔要稍微保守一些。他说:“数据分析依然没有成为主流的引援工具。在研讨会上,总有一些人跳起来说数据分析必须提高沟通的效率。他会说数据分析需要让足球人听得明白,无论是体育总监,总经理还是CEO。但奇怪的是,从来没人反过来说。从来没人说,‘足球人应该马上学习有关数据分析的内容。’”

对战术的意义:能帮你赢球

在现实里,数据分析者需要根据教练和球员们的喜好做出调整。视频分析员的任务是将数据科学家的研究结论翻译成足球语言,再传递给一线教练员和球员们。

史蒂文斯解释道:“效能分析(Performance Analysis)可以像变色龙一样,适应不同的环境。我们就是足球界的打工仔,怎么做完全取决于老板要什么。就拿水晶宫来说,从阿勒代斯到弗兰克-德波尔再到霍奇森,教练换了一茬又一茬,但我们岿然不动,因为我们能够适应他们。

“我们工作时会结合视频资料。有时候新上任的主教练会要我们出具长达80页的报告,但我会问,‘为什么?你真的会读么?’我们确实会做一些书面报告,但那是尽职调查所需。我们一般在赛前为主教练准备一份13页的报告。这13页也包括封面,其实内容只有12页,这12页的内容包括:对方出场球员预测,对方阵容信息,一页关于对方控球时如何展开进攻,一页是对方没有球权时会怎么做,一页定位球分析,一页战术调整倾向(比如在丢球是大举压上还是保持耐心),还有一张表格展示对方每名球员的情况,基本上就这些。”

在霍奇森执教期间,我们将重点放在球员针对性布置上。史蒂文斯说:“霍奇森值得称赞的一点是,如果我们说对方在控球时会这样做,那么他会说,‘嗯不错,既然他们这么做,那我们就那么做。’我们需要最后制定针对性办法,否则我们分析半天还有什么意义呢?同理,通过数据我们很轻易就能发现对方的弱点,但仅仅发现是不够的,我们还得想办法利用对方的弱点才行。比如对方门将持球时我们如何防守?如果我们踢4-3-3,锋线三叉戟是保持前场紧逼还是后撤防守?他们有一个拖后中场,好吧,是让9号回撤压迫这名拖后中场还是8号向前进行压迫?针对这些问题我们都会提出自己的建议。”

(图)霍奇森对数据研究相当重视

假设主教练愿意听取我们的意见,那球员们会有什么看法?他们会接受利用数据分析来布置战术么?在阿森纳,没几个球员对埃梅里那细致入微的的视频解析课程感兴趣。在曼联,范加尔那冗长并且措辞严厉的赛后分析环节大大打击了球员们的自信。后来范加尔改变策略,将每名球员在比赛中的失误以邮件的方式发送到他们的邮箱里。有些球员收到邮件后看都不看直接删除,后来范加尔安装了跟踪插件去查看球员们到底有没有打开邮件,球员们干脆用手机打开邮件,然后自顾自地做其他事情去了。很明显,利用视频分析讲解战术没问题,但是也需要配合过硬的人员管理技巧。有些英超球队正在使用一款名为Pushfor的应用,这个应用在法律界非常普及,其功能包括可以将客户(这里指球员)是否读了每一页内容的情况发送给发送者(这里指教练)。无论执教哪支球队,阿勒代斯都鼓励数据分析部门把分析素材发给球员们,这些分析素材或许可以提起视频分析师们的兴致,但球员们提出的问题有时甚至让人都难以回答。

史蒂文斯说:“你不会希望球员们就坐在那里茫然地点头,你希望他们说,‘我不同意’,‘我没听懂’,或是‘如果我那么做了会怎样?’等等有营养的问题。但是一旦他们认真起来,视频分析师们就不好过了,因为你也不想把话说得太生硬。

“我们现在用的软件是Hudl。球员在手机上就能看到一切东西。我指的一切东西包括赛前备战,赛后总结,他们自己的数据,对手的数据,对方门将的表现,对方定位球和点球情况等等。对于球员们在看什么,看了多久,我们这里都有记录。但是填鸭式的灌输信息没有任何意义。确实有些球员总是积极上进,但对于其他球员来说,这就是信息过剩。有些球员不喜欢全体会议,所以小组会议或是单人会议可能更适合他。为了让球员们取得进步,我们必须灵活办事。

“跟踪数据”和“事件数据”

数据“跟踪”是近几年很流行的一个概念,意思是纪录球员的活动轨迹,并监控他们在无球状态下的活动。Opta、Statsbomb和Wyscout等几家公司长于采集球员在有球状态下的数据,我们管这叫“事件数据”——所谓“事件”,指的是与球相关的事件,两者之间有着明显区别。

球员在场上的活动都可以用数据跟踪技术展示出来。但是这不能显示造成球员出现这种反应的背景环境。

我们用切尔西中场若日尼奥作为例子。我们可以统计他的传球数和传关键球次数,我们也能监控传球距离和队友冲刺的次数。不过,我们目前的模型还不能显示若日尼奥是否错过了一条更好的传球线路。一名球员可能在对方将本方压制在半场的情况下连续送出穿透性极强的直塞,另有一名球员可能在本方持续控球,占尽优势的情况下连续送出直传。在传球距离相差不大的情况下,我们从数据上看不出两者之间的明显差别,但实际上显然前者难度更大。这就是现在一个比较棘手的问题。

目前面临的挑战是,将事件数据与跟踪数据结合起来,使得教练员们可以根据这个最新的模型来评价现有球员或是转会目标球员。

Opta的前任市场总监巴诺布说道:“这是大势所趋。跟踪数据常用的过滤选项包括决断力,持球选择和做出决断的机会成本。像处理球的魄力也会被列入考虑范围,并逐渐成为一个不可或缺的选项。当人们把跟踪数据与事件数据结合起来后,足球就将展现出全新的一面。”

本赛季,英超官方将类似信息分享给了各支球队,但这种做法还没有普及到整个欧洲,而且英格兰这套系统从目前来看也并非十全十美。像利物浦和阿森纳这样走在时代前沿的俱乐部已经开发出了自己的模型。

跟踪数据与事件数据的结合也能更好地反映一名防守球员的价值。近些年,防守球员会因为做出大量铲球而被高度赞誉,但很多业内人士却不以为然。在比尔曼的《足球黑客》一书中,他引用了和哈维-阿隆索的一次访谈。

“如果我不得不放铲,说明之前我已经犯了一个错误,”阿隆索说道。“在利物浦时我经常会看一些访谈节目,被采访的对象是一些青年队的小球员,提问的内容包括年龄、偶像和自己的强项。当被问及自己的强项时,那些孩子有的会说射门,有的说铲断。我想不明白为何在现代足球里铲球会成为一项特长,居然还会被当成一项教学内容,甚至融入到球员们的比赛风格里。他们怎么能这么看待比赛?铲球是最不得已的选择,有时候你需要铲球,但这绝对不应该被鼓励。”

(图)哈维-阿隆索不赞成将铲球当成一门技术来培养

水晶宫的史蒂文斯说:“所谓防守,并不是说你要去做什么,而是说不要去做什么。放铲就真的好么?传统的教学理念是这样的,‘别放铲,站住位置准备拦截。’意思是如果我的防守位置没问题,那就意味着球永远都传不到对方前锋脚下,因为对方的传球总会被我拦截掉。所以说防守从来都是低调的工作,从来不应该被大肆吹捧。这就是我们引入跟踪数据的主要原因之一。”

现在有公司正在针对这一情况研发新产品。Sportlogiq据说已经接近成功了,但是还有很多公司企图浑水摸鱼。The Athletic之前曾经透露,曾有一个俱乐部支付给一家数据公司高达六位数的价格,但是经过调查后发现,这家公司的数据系统错漏百出。

Analytics FC别出心裁地提供了一种新的方法用以衡量防守球员的价值,虽然目前这套系统也并不完美。斯蒂尔说:“我们的计算模型能够使用跟踪数据对球员进行研究,但还不能涵盖到90个联赛。从球探的角度出发,我们将算法提供给俱乐部,是为了持续拓宽我们的视野。越多的联赛使用我们的系统,我们就能收集到越多有用的信息。

我们的算法能够衡量防守质量,这是其他99.9%的模型都做不到的。在这里我们将之前的模型颠倒了过来。之前我们曾计算了一名球员在X位置得分的概率,如果一名防守球员封堵了一次射门,球队失球的风险就因为这次封堵降低了。同理,如果一名防守球员在关键位置做出抢断或拦截,这就能反映在他的数值里。为了衡量防守球员的价值,我们不再执着于抢断的数量,而是将注意力集中于他的防守动作让本方失球的风险降低了多少。”

钱途大好的数据科学

当数学家和经济学家正努力在足球界争取话语权时,已经有越来越多的球队正在花大价钱引入数据分析系统。但是新型冠状病毒疫情却让各家球队的财务状况逐渐吃紧,现在很多球队已经给引援部门放了长假。

SciSports的首席信息官布鲁维尔说:“过去三周我们和三家俱乐部签了合同,但另有三家球队拒绝付款给我们。我们的服务是基于足球比赛的,我们帮助他们分析对手,但是现在没有比赛,我们自然也没有用武之地。现在连欧冠都延后了,数据分析公司的寒冬来了。所有的数据公司都会研发新的模型,然后在欧洲杯期间投入市场。我们也做了相关的规划,虽然俱乐部的生意不好做了,但我们还能从国家队身上找补回来。凡事都是相互关联着的。”

数据科学家们的就业之路依然光明。虽然一些顶级球队为数据工作者开的年薪尚不及3万英镑,但一些高级人才的收入已经可以媲美投资银行以及顶级咨询公司的年薪。斯蒂尔说:“现在很多球队都在寻求和数据科学家的合作。这和15年前各球队广泛寻求运动科学咨询一样。以前很多从拉夫堡大学和巴斯大学毕业的运动科学系的学生都拿着微薄的收入。他们只能去健身房打杂,或是充当球场工作人员,教练们对这些人漠不关心,他们根本进入不了足球这个行当。人们会说,‘反正他也没找麻烦,那就让他凑合着干吧。’

“现在每支球队的运动科学办公室大概都能有10名工作人员,甚至还有专门将GPS安装在球员身上并对收集来的数据进行分析的人员,这真是和以往有着云泥之别。我相信数据科学从业人员也会有光明的前景。大部分球队都配备了一名视频分析员和一名数据收集员,但很多人都没有数据科学的教育背景,他们既不是数学家,也不是数据工程师。高端人才的年薪都相当高昂,因为他们原本可以进入银行工作的。看看利物浦的维尔-斯皮尔曼吧,哈佛大学的核物理学家,他要多少年薪都有人给,试问有多少人具备他的资质?”

俱乐部会去一流大学招募数据科学毕业生并且给他们实习机会么?斯蒂尔说:“我觉得完全有可能。一支球队的其他部门只需要和同行的平行部门竞争就好了,但是数据科学部门不同,球队需要和政府、高端数字建模公司以及各大咨询公司抢人才。但是有一件事永远不会错:对于同等水平的专业人才,俱乐部永远可以用更低的价格将他们吸引过来,理由只有一个——对足球的热情。”

芬克尔斯坦相信他17年前的预言已经成为现实。他在采访最后总结道:“我最近联系了在利物浦工作的伊恩,他认为《芬克智库》栏目是大数据在足球界生根发芽的基础。我非常感激,谢谢!”

作者:  亚当-克拉夫顿(Adam Crafton)

翻译/编辑:中东游侠      

文章来源:《The Athletic》

展开更多