走近 Opta 统计员——那些在世界杯上追踪每次触球、每个传球和每个抢断的人
原文:The People Tracking Every Touch, Pass And Tackle in the World Cup作者:Carl Bialik
这篇文章发表于 2014 年巴西世界杯期间,著名数据分析网站 FiveThirtyEight.com 的专栏作家 Carl Bialik 还原了 Opta 统计员在英超最后一天的工作场景。感谢作者授权 OpenPlay 发布译文。
---
随着鼠标轻点,年轻的足球狂热爱好者们正在搭起深度数据的积木。进行、观看、分析这项运动的方式正在被这些深度数据改变着。
Opta 和 Prozone 是带来改变的公司之一。他们将足球数据带入了传球成功率、防守动作、空中得球率、抢断成功率和预期外进球数的领域,其深度远远超过进球和扑救。仅仅靠摄像头是不能处理这些数据的,所以足球数据公司们雇佣人手来观看比赛,记录每个事件。他们大多是年轻人、男性,大多将统计足球比赛作为空闲时从事的第二职业。
他们的工作使数据更加深入。那些没有进球,却为进球贡献了精准传球和争抢的球员们的价值被挖掘出来。球队借助深度数据来决定引进哪些球员、安排哪些球员上场。不管球迷是否乐意,都会读到、听到比以往多得多的足球相关数字。要知道,一直以来足球都是反体育数据分析潮流的。
上个月的一个周日,Opta 邀请我去他们位于伦敦南部的总部,当时统计员们在追踪英超的 10 场过往比赛。我站在成排的年轻人中间,他们在电脑监视器前仔细审视比赛,有时一边在监视器上追踪直播,一边在另一台监视器上倒带核对疑难事件。他们的主管从自己最喜欢的球队的比赛中抬起头来,确认每个进球对应的球员是否记录正确,此时我尽量不做打扰。我旁观 Opta 媒体团队将事件流(每场比赛产生 1,600 到 2,000 个事件)处理成为电视直播解说词,之后他们会听到解说员向观众重复这些内容。
和其他数据采集一样,在足球数据中,大数据是人工收集,一点点构筑出来的,会受人的局限性、心情和偏好影响。全年有 350 名兼职统计员在 Opta 伦敦总部和其在欧洲、美洲的其他 6 家分部工作,他们或观看直播,或录制视频,记录下全球超过 14,000 场比赛中的每个传球、头球和进球。
Opta 认为软件、规范和监管可以帮助他们利用人类判断力中最好的部分,并且限制潜在的不足。他们把数据背后的人视为卖点。我不是第一个被邀请来观看统计的人。Opta 现任 CEO 艾当·库尼表示,许多准顾客会在比赛期间来参观,「老实说,这样能做成生意。」
Opta 向职业俱乐部、国家队、联赛和媒体提供数据,他们是英格兰、西班牙和德国顶尖机构组织的官方数据提供商。
一件提姆·提伯的运动衫和一顶洋基队的帽子
我在 Opta 的一天异常忙碌:每家英超俱乐部都在进行赛季的最后一场比赛。末轮不像 2012 年的那样精彩,曼城几乎锁定了联赛冠军,利物浦逆袭的可能微乎其微,而且欧冠和欧联的大多数席位已经确定。最大的悬念是热刺最终名列联赛第 6 还是第 7。
对于 31 岁的保罗·佩蒂特来说,情况是这样的。他是数据统计助理经理,也是热刺球迷。他花费了两个小时时间交替追踪热刺对阵阿斯顿维拉的比赛。当热刺取得开场领先时,他说他希望热刺能赢球,以 25 球的总进球数结束末轮比赛,这样可以依靠净胜球优势争取联赛第 5 名。保罗从自己的椅子上跳起来,急着查看其他比赛的进展,比如说斯旺西早早进球是否会使导致一切与自己的期望偏离。所有记录下的事件都在屏幕上从上向下滚动,重要事件一出现,他就会和统计员进行讨论。
足球中较少出现的暂停对统计员们来说无比珍贵。漫长的进球庆祝允许他们退回重看进球及其它重要事件。保罗经常旁观这一过程。
但统计工作的重头戏在于记录传球路线。Opta 的数据分析师们通过在接球点拖拽和点击鼠标来记录每个传球,随后标记出是谁接到的传球。他们监视器中的背景图片是足球场,上面覆盖了一层比赛直播视频。
在我看来令人困惑的是,图片几乎无法和球场上的影像对应。所以统计员们不得不在矩形视频上将鼠标移至与球的位置毫无关系的点上。我看到的统计员们都没有纠结这点,毕竟,这是这赛季第 38 轮,也是最后一场比赛。
这 10 场比赛中每场都配备两名统计员,还有一名统计主管。每个统计员都有自己的监视器,并且只追踪一支球队的触球情况。有时统计员会商量某些事件。「这是抢断吗?」利物浦比赛的第四分钟,统计员问出了这样的问题(实际上不是抢断)。
直到 8 年前,Opta 还没有产出这么多电视直播数据。保罗·佩蒂特从 2001 年开始为 Opta 工作。他很幸运,因为当时 Opta 刚刚淘汰了依靠纸笔记录的统计方法。但他不幸遇上了录像机的时代,在无数次倒带重看之后,他回忆道:「没过一会儿我的肘部就开始痛了。」
「一支球队的阵型越特别,统计其比赛就越难。像巴萨那样组织有序的球队就很容易统计。」Opta 的英国统计主管哈里德·侯赛因说道。如今他非常享受有挑战性的比赛。
在侯赛因工作量最大的时候,每个英超赛季里,他每周都要统计 10 到 15 场比赛。他最初被指派为阿森纳统计,每周还要花 4 个晚上统计世界其他地区的足球比赛。他曾经一天内统计了 6 场比赛。「最后我回到家时状态超级差,」侯赛因说。
一丝不苟的统计工作改变了现年 33 岁的侯赛因观看比赛的方式。他变得对阿森纳「充满热情」。比起观看国际足球主流观点中的经典对决——西班牙国家德比,他甚至更享受枪手对阵斯托克城的比赛。当他在场地的一端点击一个名字,随后在另一端点击相同的名字时,他开始欣赏在赛场上跑动范围大的球员,而不是那些惹人注目的盘带高手。
他也认识到他从前钟爱的控球率数据其实没有那么大的意义。「在这儿(Opta)的工作戳破了我的想象」,侯赛因说,「控球多少并不重要,拿球以后的处理才重要。」
侯赛因现在主要是做统计主管,但有需要时他也会投入到统计工作中。我在 Opta 的这一天里,他统计了卡利亚里 0 :1 输给切沃的比赛。和其他不熟悉自己被分配到的俱乐部的球员及阵型的统计员一样,侯赛因观看了卡利亚里近期比赛的 DVD 作为准备。
侯赛因管理的统计员年龄主要在 18 到 24 岁,且多为男性。(侯赛因:「我们在利兹有两名女性统计员,在德国也有一个。」)他们热爱体育,他们玩 NFL fantasy,他们回家玩电视游戏。我去的那天没人穿球衣,不过我看到了一件提姆·提伯(Tim Tebow,著名美式橄榄球运动员——译者按)的运动衫和一顶洋基队的帽子。
「这帮助统计员们成为足球狂,并且重视这份能让他们入行和看球的工作。」佩蒂特说。
统计员候选人需要接受测试,测试内容包括对考察其足球的理解,还有使用 Opta 统计软件时眼手的协调性。他们得快速用左手盲打。有时持证足球教练不需要接受眼手协调性测试;喜爱 PlayStation 的玩家则经常需要。「我们对他们进行时长五小时的测试,从中选出最好的。」侯赛因说。
在这一阶段,成功的申请者离统计比赛还远得很。至少再过一个月,他们才能产出可用数据,甚至让他们在最简单的情况下统计一场录好的比赛,数据也不可用。「为了训练,他们会在两三天内反复统计同一场比赛。」侯赛因说。
Opta 现任 CEO 艾当·库尼尝试过亲自上手统计。「结果喜闻乐见……」他说,「根本办不到……对于运动技能跟我差不多的人来说,(完成统计)是不可能的。」他又补充道:「如果你不玩 PlayStation,基本也没戏。」
Opta 聘请了全职统计员来复查每个统计事件,整个复查过程要耗费 3 到 5 个小时。佩蒂特称 Opta 的直播统计员识别球员的准确率可以达到 99%。
统计员的表现会有相应的评分,最好的统计员可以统计更多的比赛。这造成了一种竞争,并且能「促使他们全心投入工作」,侯赛因如是说。如今,侯赛因确定自己是伦敦最好的统计员之一,也开始到欧洲的各个 Opta 办事处去培训统计员。
争议进球委员会
Opta 的竞争对手包括 Prozone,Prozone 使用摄像机和球员识别系统来追踪球场上的球员。斯图尔特·梅尔斯是 Prozone 美国地区的主管,他说公司的光学追踪系统(类似 NBA 使用的 STATS SportVU )胜过 Opta(Prozone 已于 2015 年被 STATS 收购,SportVU 也已广泛应用于足球——译者按)。该系统每场比赛产生上百万数据点。
梅尔斯说,和 Opta 一样,Prozone 也需要人来统计。Prozone 的摄像机无法区分聚在一起的球员,也不能辨别重要比赛事件。所以他们雇佣了编码员。编码员通常是实习生或者对足球感兴趣的学生。编码员也像在 Opta 里的统计员一样,接受更有经验的主管的监管和培训,遇到重大比赛时还会有更有经验的编码员作为补充。
库尼说 Opta 正在提供不同于摄像机追踪的东西:「人们需要数据分析,需要全部数据打包,这些只有我们能给。」
保持各个办事处的统计标准一致对 Opta 来说至关重要。「助攻」在伦敦、纽约和蒙德韦迪亚(乌拉圭首都)必须是同一件事。足球数据的质疑者已经够多了,不同公司统计出不同数据对于赢得信赖没有帮助。独立数据公司有时会改变他们的统计项,例如 Opta 几乎每年都在年度回顾后这么做(即将发生的改变就有:在「犯规」的事件定义中添加更多细节)。
一家公司的数据历经时间和空间的考验依然值得信任,这是最重要的。「我们对「解围」的定义(一名防守球员将球踢出球场)一直是一样的,并且不会改变。」佩蒂特说。
除了比赛前瞻,Opta 还监控着英超各处数据,以确保数据不会有太大出入。如果有出入的话,就是踢球风格所致,而非统计员的问题。
Opta 也会根据争议进球委员会的决定来更新自己的数据。射门中球弹到防守队员身上时,由这个委员会决定进球是否有效。
比赛比分接近意味着直播数据暂时不会变化。这对电视解说员来说很有利,他们会接二连三地向 Opta 媒体团队发消息提问。我走来走去,旁观媒体小组在比赛期间的一举一动。他们坐在有 6 块电视显示屏的墙边工作,通常 6 块屏幕已经绰绰有余了,但是我在的这一天,他们缺少 4 块屏幕,所以笔记本电脑填补了空缺。
比赛期间,媒体小组动作迅速。利物浦的马丁•斯科特尔刚在比赛 20 分钟打入乌龙球,邓肯•亚历山大(Opta 英国地区的内容和客服主管,当时 36 岁)就告诉他的同事「去干活」,换句话说,就是去核对斯科特尔是否创造了英超历史上单个赛季打进乌龙球最多(4 个)的记录。确认后的数据被发送到天空体育,在一段商业广告后被解说员杰夫•斯特林 (英国著名体育记者,曾于 2011 至 2015 年为天空体育一档节目报道欧冠——译者按)公布出来。
随后,斯特林提到富勒姆本赛季已经有 38 名球员上过场,也创下了新纪录。我问亚历山大这项数据是否来自 Opta,他点了点头。
拥有这些数据很美妙,但这并不会改变教练们排兵布阵或选择战术的方式。不过,Opta 及同类公司的努力慢慢将足球带入了更加广阔的体育数据革命之中。 亚历山大和佩蒂特指出助攻越来越重要了,可就在十年前「有些人还对助攻不屑一顾。」
Opta 的足球数据专家们承认他们的数字并不适合所有人。亚历山大说:「总有球迷说他们只在乎左上角的那一个数字——比分。我们又不是奋锐党 (激进党),不会边敲鼓边说,你们一定得像我们一样看球。」
------
题图:FiveThirtyEight.com