虎扑独家签约作者 |羽则


2015年10月下旬的某天,刚成为利物浦主教练半个多月的克洛普在办公室迎来了一位特殊的“客人”。短发平头、黑框眼镜、纯色衬衫,一手笔记本电脑一手便携式打印机,浑身上下都透露出仨字:技术宅



做完简单的自我介绍,他好几分钟一声不吭,打印出满桌的数据表格和比赛照片。克洛普一脸懵逼,场面略显尴尬。


随后,他拿起一大堆资料开始分析起上赛季多特蒙德和美因茨的一场德甲联赛。那场比赛里,克洛普的球队从基础到高阶各种数据都是对手两倍,但点球罚丢又打进乌龙,最后0-2输了球。克洛普的眼睛亮了起来:“啊,你看过那场比赛,太疯狂了我们明明完全压制了他们!”


对方回答到:“没看过,我只是想说你运气不好。”


接着,他又开始分析之后多特蒙德与汉诺威的另一场德甲。数据更疯狂,大黄蜂几乎全是对手的三倍,可还是0-1输掉了比赛。兴趣渐浓的克洛普几乎喊了出来:“我从来没见过那天发生的事情!我们本该赢球!那你一定是看了这场!”


对方回答到:“不,不,我真没看过,我是想说你这场运气更不好。”


会面就在直男范十足的尬聊里结束了。摸不到头脑的克洛普打电话给当时的俱乐部CEO艾尔,想弄清楚来者究竟何意。艾尔回答到:“哦,伊恩(格雷厄姆)啊,咱们数据分析团队的负责人,他这人就这样,以后你们就是同事啦!”


第二天,艾尔又给克洛普回了个电话:“哦对了,就是他拿着一堆数据模型,告诉我们你在多特最后那个赛季本该排在联赛第二,只是你很倒霉地执教了德甲史上最倒霉的一支球队,最后才拿到第七。就是因为这样,我们下定决心把你找来了。”


……两人的第二次见面,克洛普给了格雷厄姆一个大大的熊抱,就像后来他对球员做的那样



01

一个造核弹的团队

利物浦数据分析团队现在是个什么构成呢?常规配置六人,具体名单如下:


——伊恩-格雷厄姆,也就是前面这位。团队带头人,剑桥大学理论物理学博士,毕业后留校进行高分子物理的博士后研究。


——威尔-斯皮尔曼,哈佛大学高能物理学博士,在日内瓦欧洲核子研究所工作时发表了一篇论文,提出了世界上第一种直接测量粒子宽度与质量的方法。


——达菲德-斯蒂勒,数学硕士,拿过青年国际象棋全国冠军,被利物浦挖来之前在一家跨国能源公司当分析师。


——蒂姆-瓦斯基特,卡迪夫大学天体物理一等荣誉学位持有者,此前工作于一家物理实验室,业余开发了几个独立游戏。


——马克-霍利特和马克-史蒂文森,他俩负责维护数据库和编写PPT等技术工作,让前面四位可以专心搞研究。


(瓦斯基特和他充满物理风格的“数据板”)


前面那四位,其中的任何一个可能都不会被其他足球俱乐部雇佣。可偏偏利物浦把他们全都“收集”了起来,然后把这个被BBC称为“能造核弹的团队”,拿来帮助克洛普决定在转会市场上买谁不买谁。


其中,格雷厄姆的经历最特殊,而他也正是这群人能聚到一起的核心。


2005年,格雷厄姆拿到剑桥大学博士学位之后留校搞起了科研,因为儿时的梦想就是成为一名科学家。然而梦想这东西并不一定真是自己想要的,他在工作一年后逐渐开始觉得现在的生活并不适合自己。


一次偶然的机会,他在剑桥考试中心工作的女朋友(没错他有女朋友)收到了一名教授群发的邮件,其中包括一份广告:有人正在招募有学术背景的足球数据统计员。妹子把广告转发给了男友,附上留言:“我记得你好像说过自己喜欢足球?”


他后来说:“这真的是偶然中的偶然,幸运中的幸运,因为我就从来没在她嘴里听说过足球这个词。”



格雷厄姆出生在南威尔士的斯旺西谷,那里的人们普遍更喜欢橄榄球。但年少时他在电视上看到了利物浦的比赛,而且队内头牌拉什也是威尔士人,这使得他从此成为了一名足球迷,也是利物浦球迷。


科学+足球,格雷厄姆看到了把爱好和工作结合在一起的可能性


五天后,他辞掉剑桥的工作,加入了这家名叫决策技术(DecisionTechnology)的体育数据公司,先后负责下面这三项工作。


——在《泰晤士报》每周的数据专栏《芬克坦克》(The Fink Tank)撰文,分析球员表现和评分,这活一干就是六年半;



——接受当时热刺足球总监科莫利的委托,进行了多个一次性的球员分析项目。比如“我们想买XXX,你帮我用数据看看靠谱不靠谱?”,或者“我们队里的XXX最近感觉不太行,你用数据能不能看出到底是个人还是战术原因”;


——雷德克纳普执教热刺后,不喜欢足球总监的老雷把科莫利赶下了台,但留下了和决策技术的合作。而热刺指派给格雷厄姆的新联系人是老雷从朴茨茅斯带来的视频分析师,现在利物浦球迷非常熟悉的“爱总”迈克尔-爱德华兹。在爱德华兹的支持下,格雷厄姆开始给热刺定期提供引援建议。



没过多久,在利物浦当上总监的科莫利回过头把爱德华兹也挖到了红军。两位对数据十分感兴趣的前热刺员工一合计,觉得决策技术的身上大有潜力可挖,未来必将引流数据潮流。


然而由于和热刺有合同里的竞品限制,决策技术无法和利物浦签约。怎么办呢?科莫利直到2012年4月离任也没想出办法,但机智的爱德华兹半年后找到了答案:公司签不了,我把干活的人挖来不就行了


还记得前面说过格雷厄姆是哪队球迷吗?听到了来自主队的召唤,他几乎立刻做出了从决策技术辞职的决定,北上利物浦。那时的爱德华兹已经开始从技术岗逐步转向管理岗,于是利物浦新版数据分析团队基本上是围绕格雷厄姆搭起来的。


那么,这个“能造核弹的团队”,具体做了哪些事呢?


02

那些年数据买来的球员

利物浦数据团队最核心的工作内容还是帮助俱乐部决定买谁不买谁,用格雷厄姆自己的话来说:“这就是他们付我钱的原因。”而他入职后的第一份活儿,就是给一名年轻的巴西球员出份分析报告——库蒂尼奥。


在决策技术工作的六年多时间,格雷厄姆捣鼓出了一个原创的数据模型,具体来说就是确定球员的每一个有球动作会对比赛的胜负带来多大的影响。基础内容,包括下图这个通过世界各大联赛累计数十万次射门总结出的进球概率分布,和普通人的认知基本相同。



复杂内容,包括后卫在后场特定位置的一次成功抢断,与前锋在前场特定位置射正球门,如何用数字比较两者的价值。这也是后来利物浦愿意分别打破后卫和门将转会费世界纪录,签下范戴克和阿里森的重要原因之一


还是先说回库蒂尼奥。格雷厄姆向俱乐部提交的第一份报告里对库蒂尼奥给出了高度肯定,结合他对比赛的影响力和市场行情,得出了“国米要求的850万英镑不到其实际价值1/4”的结论。管理层立刻拍板买下了他。


至于五年后转会巴萨翻了多少倍,那就是另一个故事了。



如果你回去看看利物浦从2013年冬窗开始的转会,会发现很多人都有着浓浓的数据分析成分。从库蒂尼奥到阿斯帕斯、阿尔贝托,再到菲尔米诺、萨拉赫和凯塔……有些非常成功,有些不尽人意。毕竟足球世界里的数据分析才刚刚起步,远远解释不了所有的问题。


格雷厄姆很快发现,自己的初版模型有个巨大的缺陷,那就是没走出传统数据分析只能衡量有球活动的局限。而足球比赛里的无球活动远比其他运动数量要多,也重要得多。阿斯帕斯和阿尔贝托在利物浦过得很挣扎,离开后却生龙活虎,可能就是因为:球只有一个,球权都不够分还谈什么有球价值


随着团队的扩大,利物浦数据团队开始改进这个模型。


第一步,瓦斯基特开始往模型里加入团队配合对比赛的影响。毕竟,如果你在反击里看到两名队友都跑出了得分概率相似的抢点位置,比起传给斯特林,传给苏亚雷斯显然更合理对不对


这项改进带来的最具代表性的转会,就是——萨拉赫



敲定萨拉赫之前,利物浦数据团队对他进行了一次多角度的评测。


格雷厄姆得出的结论是,萨拉赫对比赛的决定性被严重低估了。哪怕是在不尽如人意的切尔西时期,他对胜负的影响均值也没有低于之前在巴塞尔或者之后在罗马。他不是像传统专家分析的那样“不适合英超”,而只是和当时的切尔西八字不合


瓦斯基特得出的结论是,萨拉赫能和菲尔米诺组合出爆炸般的效果。因为菲尔米诺在中锋位置上能给边锋带来五大联赛最高的期望进球,而萨拉赫的对抗和射门数据能最大化的利用这点。2019年他试图向BBC记者解释具体原理,但在一大堆晦涩难懂的天体物理名词砸晕所有人之后,数学硕士斯蒂勒帮同事简化成了一句:“你们就认为是1+1>3吧!”


这真不是《生活大爆炸》里才有的剧情?!



第二步,斯皮尔曼开始向模型里加入最困难的无球活动。具体来说,就是利用高速视频跟踪技术标记出球员的每一次连贯活动,然后量化其价值,哪怕他们的行为根本就和皮球的运行轨迹没任何关系。


比如,球队的一次右路反击没打成被抢断,该过程里左边后卫前插跑到了什么位置?又比如,当队友的一次传中较高没碰到任何人就出了界,中锋争顶时跑到了哪,起跳高度又是多少?以及最重要的是,给出上面这些行为究竟有多少价值的具体数字


听上去有点“虚”对不对?这只是一项刚刚起步的研究,还远远谈不上成熟,所以斯皮尔曼自嘲“利物浦的成功目前还没我什么贡献”。目前,这套理论最拿得出手的发现是“法比尼奥在中后场的跑动对攻守都有巨大价值”,不过在他提交报告前,克洛普和爱德华兹其实就已经决定要从摩纳哥签下这个巴西人。



格雷厄姆说:“我们的数据仍然存在根本的局限性,就像通过迷雾看世界。我们所做的,就是希望能找到穿越这片迷雾的通道。”


穿越迷雾的过程里,必然会有误入歧途和绕远路。数据流买来的球员既有成功范本,自然也有失败或者暂时不成功的案例,比如:纳比-凯塔。很多球迷以为凯塔是因为克洛普偏爱才来的利物浦,但其实更多源于格雷厄姆


凯塔还在萨尔茨堡红牛效力的时候,格雷厄姆就盯上了他。由于他一会打后腰、一会打中前卫、偶尔还客串前腰,角色的变化导致传统数据非常混乱。球探和专家们都把他概括成“全能中场”,但格雷厄姆发现:虽然凯塔的传球成功率比顶级中场低,但一旦他传球成功,队友打出威胁进攻和射门得分的概率比那些中场还要高



因此,格雷厄姆认定凯塔足以成长为一名世界级中场,而且是最好的几个人之一。从2016年1月开始,他在每一个转会窗给管理层提交的引援清单里,凯塔都在前两名。最终,利物浦在2017年夏窗使用“今年的欧冠资格激活明年的解约条款”的骚操作预订了凯塔,格雷厄姆得偿所愿。


但由于伤病和种种原因,凯塔至今还没达到他希望的高度。而就是因为这样的巨大落差并不少见,使得这个行业的很多人提起数据仍然不屑一顾。


03

“没见过克洛普这样的教练”

2011年,布拉德皮特主演的《点球成金》上映。足球数据公司OPTA的创始人欣喜地把这部电影的DVD寄给了英超20家俱乐部的CEO,希望他们能从北美的“魔球理论”里得到灵感寻求合作。最终,他得到的回应人数是——0。



这基本可以代表当时足球行业对数据的态度。虽然那时的切尔西已经成立了英超第一个数据分析部门,阿森纳直接收购了一家数据公司,但由于足球比其他运动复杂太多(尤其前面我说的无球方面),俱乐部其实就是赶个潮流,掌握实权的老派足球人压根就毫不在意。


阿勒代斯曾经说过:“我们这种赛事是永远无法预测的,用统计数据来做决定太不靠谱了,咱们说的可不是什么棒球和橄榄球哦。”


前切尔西中场克雷格-伯利面对ESPN镜头说:“预期进球?数据什么的都是胡说八道,我还希望圣诞老人能给我礼物呢,但他根本就不会出现。”


这就是其他俱乐部不太可能凑出“造核弹团队”的原因。


但利物浦是什么情况呢?美国老板约翰-亨利儿时在自家农场沉迷APBA棒球,一种类似球星卡、带有数据和数值的卡牌游戏,成年后靠着“类似的数字推算”在大豆市场发家致富。《点球成金》结局里想挖主角的波士顿红袜就是亨利的球队,现实世界里他们后来也靠着“魔球理论”拿到了冠军。


当亨利收购利物浦之后,自然把这一套数据理论带到了红军。负责人是之前在阿森纳和热刺当总监的数据狂魔科莫利,最初执行人就是当时还在做技术活的爱德华兹。



然而就算从上而下这么多数据派,俱乐部内部仍然对新技术并不服气。


“魔球理论”实行的第一个赛季,球队成绩不佳,包括亨德森在内累计超过1亿英镑的引援被视为普遍失败,科莫利这个总监当了不到一年半就背锅走人。虽然亨利留下了爱德华兹和继续升级了数据团队,但格雷厄姆等人在俱乐部的地位非常尴尬。


首席球探巴里-亨特给他们起了个“只会敲笔记本的人”(laptopguys)的外号,说这群人根本就不懂球。其实他也没说错,laptop guys里面也就格雷厄姆是球迷,另外三个理科男之前连一场比赛都没看过,美国人斯皮尔曼甚至是来到利物浦之后现学了足球规则。


罗杰斯私下和助教说过“他们就是来办公室蹭空调的”,那时的房叔对数据完全不感兴趣,俱乐部内部出现了严重分裂。


——一开始,利物浦每笔引援都要走一遍格雷厄姆的模型,过不了的被一票否认,通过了的罗杰斯不一定喜欢用。结果……红军球迷应该还记得那些年对“转会委员会”吐过的口水。


——3S大杀四方那个赛季后,腰杆硬了的罗杰斯接过转会大权。但他不顾数据部门反对,力主签下的黑风双煞……好吧。



所以,当克洛普入主利物浦时,俱乐部里很多人都在担心他和数据部门要如何相处,这才有了发布会上记者连问三个关于“转会委员会”的问题,以及文章开头我说的那次会面。要知道,之前在德甲执教了那么多年,渣叔从来没有和数据分析师有过任何合作


克洛普的反应让很多人感到了惊喜,用格雷厄姆的话来说:“我也算在足球这行干了不少年了,但从没碰见过克洛普这样的主教练。”


一方面,克洛普虽然是更相信直觉和经验的传统教练,但并不排斥新技术。在多特他就搞了套“铁笼足球”的训练机器,之后也带到了英超。新闻里老乡朗尼克在萨尔茨堡红牛弄了花样繁多的黑科技,克洛普这两年让利物浦陆陆续续给他配了大半套同款。


另一方面,就像现任门兴主帅、被称为渣叔爱徒的罗斯所言:“克洛普塑造了我们所有人,尤其是在对待他人的方式上。”不止是给了格雷厄姆一个大大的拥抱,渣叔后来对待laptop guys的态度,充分展现了自己的情商


(这张合影被戏称为“利物浦转会委员会2.0”)


他对数据团队的工作非常尊重,也信任他们提出的报告。克洛普曾经在采访里说过:“我知道伊恩(格雷厄姆)的数据库里有超过10万名球员,我也欢迎他随时走进办公室,告诉我其中哪个人简直酷毙了。”


但他也同样相信自己的判断,以及传统助教和球探们给出的意见,划分出了不同工作的职能范围。“不懂球”的数据分析团队绝对不会主动去对球员和助教指手画脚,教练团也不允许嘲讽数据团队的工作。双方以互相尊重为前提进行合作,不搞对立。


作为两方面信息的交汇点,克洛普把转会的最终决定权牢牢握在自己手里,既不独断专行,也不全听数据。看法不同没问题,必要时开个会求同存异


听起来容易,但其实很少有教练像克洛普一样做得那么坦诚和融洽。


比如,格雷厄姆的团队除了推荐引援之外,也会为教练们提供赛前和赛后分析。张伯伦就说过:“我们知道有人会花好几个小时总结出一大堆数据表格,但主教练不会把任何数字丢给我们,而是挑重点直接告诉我们比赛里该怎么做。”


聊两个经典案例。


2017年与布莱顿的比赛前几天,一名负责调查对手的球探告诉克洛普,他觉得布莱顿防守任意球时的人墙经常喜欢高高跳起。克洛普把这事转达给格雷厄姆,数据团队分析发现确有其事,布莱顿人墙全体起跳的概率在英超近五年来首屈一指。赛前渣叔把这事讲给了全队,之后有了库蒂尼奥的这个进球



2019年与热刺的比赛前,作为重点研究对象之一,数据团队给克洛普提交的报告里写满了对方每一名球员左脚和右脚在不同区域处理球的效率值。教练组赛前从中提取重点对球员们做出了强调,之后诞生了那个足以写进教科书的1防2。


当然,这球如果不是范戴克堪称完美的判断和脚步,光有数据估计也没什么卵用。但数据+教练+球员,融洽的合作就是有这么大的作用



不过,就像格雷厄姆说的那样,足球世界里的数据远远没达到能解析比赛的水平,甚至还有很多与现实看起来完全相反的矛盾。比如利物浦数据团队也曾经不止一次在报告里写到:角球的价值被远远高估了,实际上并不需要在训练里花费太多时间


因此,当下面这段更加经典的故事发生后,格雷厄姆立刻给当时采访他的《纽约时代》记者发了封邮件:“这事和我们真没关系,你别瞎写……



我不想神话任何人,因为利物浦在数据方面的成功看起来充满偶然:一套从上而下重视数据的管理层、一群顶尖水平的数据团队、一个尊重但不盲从的主教练。他们之间的观点有时相同有时相悖,却能尊重、沟通,不甩锅。


这真的太难得了。


当然,利物浦数据团队取得的成绩有目共睹,这样的偶然或许会在更多俱乐部渐渐成为常态。




/ / 今日话题 / /


JRs对现代足球与数据分析结合的看法是?

往期回顾


上一篇: 尺寸接近高尔夫,采用宝马发动机!450牛·米还是四驱,这小车挺狂!
下一篇: BBC记者疫情后街采,北京市民:“那肯定比你们国家强。”