当前位置:首页 > 足球资讯 > 正文内容

巴西队提前出线,预定大力神杯?数据分析告诉你,到底谁才是冠军

杏彩体育2年前 (2023-03-01)足球资讯69

#2022世界杯#

2022年卡塔尔世界杯的第一轮小组赛,已经在众多惊诧、悲伤、惊喜的情绪中结束,而仅仅是第一轮的小组比赛,不断爆出的冷门就足以使人大跌眼镜了:

连续34场世界大赛不败的潘帕斯雄鹰——阿根廷,1-2负于世界排名51的沙特

四届世界杯冠军得主的德意志战车——德国队,1-2负于从未进过8强的日本

让无数强队忌惮的南美洲天蓝军团——乌拉圭,0-0被称为世界杯鱼腩的韩国队逼平

自从揭幕战上卡塔尔打破了“世界杯揭幕战东道主必胜”的铁律,就预示了2022年卡塔尔世界杯注定是一场不平凡的大戏,也许世界杯冠军的宝座上会迎来又一位新王。

欢喜的背面一定是悲伤,此时一定有无数的球迷为自己的球队欢欣鼓舞,也一定有无数的球迷正在黯然神伤,最终究竟谁能捧起大力神杯,是众星璀璨的新人、还是老骥伏枥的旧主,没有人能猜得出,但我们或许可以从大数据预测中窥得一二。

构建世界杯预测的模型

(想看预测的直接略过这部分)

自从现代足球逐渐商业化之后,无数人开创了大数据分析模型来试图预测足球比赛的胜负,然而因为足球比赛的影响因素比吃饭喝水要复杂的多,球队阵容、球员能力、球员状态、球员心理、球队战术、球队磨合度、球队配合度等等,每一个因素的风吹草动,都会牵一发而动全身,影响最终的结果,预测的结果可能会与现实大相径庭。

但是大多数模型背后的机理,基本都有着泊松概率分布模型的影子:

这个模型看起来复杂难懂,其实它有着朴素且美丽的魔力,能够“准确”预测几乎所有事件的发生概率,它的原理则更为简单,可以用几句话就解释清楚:

我工作时会喝水这个事情,要么发生、要么不发生;我喝水这个事情在某个时间段内我是已知的,比如平均一上午喝两次水;我喝水这个事情在某个时间段内发生的概率是一样,任何时候都可能喝水;我这次喝水和下次喝水的事件是独立的,互不影响;

那么,这个事件就可以用泊松分布的公式进行解释,以足球预测为例,我们可以以“某队在一场比赛中进球”为事件,用K表示我们期望球队进几个球(事件发生多少次),用λ表示在一场比赛的时间内发生事件的平均数,这个我们可以通过每个球队世界杯上每场比赛的场均进球即可,最后得到一个概率图形,进而得出一个球队进1个球的概率、进2个球的概率、进N个球的概率分别是多少:

而正是因为足球是复杂多变的,不能仅仅用场均进球来估计结果,因此我们通过球队的场均进球、场均失球、场均胜率、场均败率、场均平率等数据来综合估算出一个球队的实力,当然这个模型就各有各的算法,我们就取最简单的“攻击力”模型。

通过BI进行分析和解释

首先就是解决数据的问题,好在所有国家队的数据都可以从网上进行下载,然后在excel中计算出每个球队进球的泊松概率:

然后我们将数据导入到专业的数据分析软件FineBI中,进行进一步的数据清洗和处理,首先就是对数据进行数据合并,按照世界杯小组赛的分组将不同的数据进行合并,组建出“某队对战某队”的数据格式,然后利用我们的“攻击力”模型,导入数据函数新建出几个数据列,表示球队的进攻力指数:

具体过程这里就不赘述了,数据清洗阶段结束后就要对数据进行可视化分析了,利用FineBI的可视化操作界面可以很轻松的组合出我们想要的数据,比如身价对比、夺冠对比、净胜球对比等等,最终美化一下就可以呈现出这样的效果:

预测出线概率详解

最重点的是我们根据“进攻力指数”估算出了每个球队的进攻强度,然后利用泊松概率就可以算出每场比赛球队最可能的比分,这里我们用场均进球展示:

表中像卡塔尔这种第一次参加世界杯的国家,因为缺少历史数据参考,因此只能根据亚洲成绩将攻击力人为地设定一个值,所以是比实际实力要虚高的。

我们可以以G组为例,表格中的数据展示,喀麦隆对瑞士的净胜球大概率为-0.57,而瑞士对喀麦隆的净胜球大概率为0.71,即双方差距1.28个球;而现实结果中,瑞士与喀麦隆的成绩是1:0,与数据预测的相差无几;

这时候我们再来看一看为什么说开头的那三场比赛,冷门的离谱:

数据预测,阿根廷对沙特的净胜球大概率为3.29,比分预测为3:0,而实际结果是1:2落败;

德国对日本的净胜球大概率为2.48,比分预测为2:0,而实际结果是1:2落败;

乌拉圭对韩国的净胜球大概率为1.06,比分预测为1:0小胜,而实际结果确实0:0被韩国逼平;

根据其他专业机构的预测数据现实,赛前沙特战胜阿根廷的胜利不足1%,然而种种因素却造就了本届世界杯上最大最大的冷门,也让阿根廷人品尝了亚洲足球的苦果。

用这个模型继续推导可以模型出最终淘汰赛的最终结果,这里因为系统还需要优化就没有继续推导,但是在finebi里计算了一下,结果显示巴西本届世界杯夺冠的概率是最大的,概率与前几天疯狂流传的大数据机构预测机构相差不多:

此外我还做了一些其他有意思的数据统计,比如球员身价统计:

冠亚军数量对比:

国家队平均年龄对比:

加纳平均年龄只有24岁,绝对的青春风暴;而西班牙也只有25岁,这支斗牛士军团正在更新换代的关键期,以加维为代表将继续扛起伊比利亚足球的大旗;

巴西、比利时、阿根廷、克罗地亚的平均年龄都在27岁以上,阵中老将非常多,如内马尔、德布劳内、莫德里奇、梅西、迪马利亚等足球历史上闪耀的明星,都已进入了职业生涯末期,世人最不肯见英雄迟暮,但他们都将为了自己一生的理想而拼尽最后一秒。

数据是冰冷的,足球是温暖的,数据预测并不能取代和代表现实,赢负胜败并不全部,真正让我们着迷的是场上的22名球员、与场下的教练、球迷一起为追求理想而不断敲开紧闭的大门,奋力揭开幸运女神身上冰冷的面纱,而这正是足球、正是世界杯的魅力所在。

因为,我们爱足球当然不是爱他的成败,我们爱的就是那种气质,不是吗?

扫描二维码推送至手机访问。

版权声明:本文由财神资讯-领先的体育资讯互动媒体转载发布,如需删除请联系。

本文链接:http://www.tengj.cn/?id=64383

分享给朋友:

“巴西队提前出线,预定大力神杯?数据分析告诉你,到底谁才是冠军” 的相关文章

小组第二晋级?遭韩国逼平,乌拉圭能否抗衡有C罗压阵的葡萄牙?

小组第二晋级?遭韩国逼平,乌拉圭能否抗衡有C罗压阵的葡萄牙?

1950年以前两度获得世界杯冠军的乌拉圭国家队,自二十世纪1950年代迄今一直在世界杯小组赛浮沉,早已不复八、九十年前世界足坛霸主的荣光。近年在苏亚雷斯领衔之下,乌拉圭于2018年俄罗斯世界杯A组小组赛,先后小赢埃及、沙特阿拉伯与东道主俄罗斯,以A组三场全胜之姿晋级十六强。随后十六强单淘汰...

2020年世界足球联赛排名:中超联赛世界排名第43名,亚洲第4名

2020年世界足球联赛排名:中超联赛世界排名第43名,亚洲第4名

  记得以前有许多球迷调侃:中超联赛是世界第六大联赛,这也反映出了当年中超随着大牌球星的加盟,中超联赛的知名度与关注度大幅度提升,但是由于足协出台了投资帽与工资帽,所以说许多大牌球星出走,这导致中超的知名度、比赛观赏性、球迷数量等下降,中超联赛在世界足球联赛的排名肯定会受影响的。...

老彩民关于竞彩⚽的一些经验分享

购彩13年,起起落落,总结了一些方法,分享出来,和各位球友交流交流。 那么,购彩之前需要做点什么工作呢? 一:看比赛双方的排名、阵容、状态等 1.上周各队战绩。了解每支球队的动态,首先需要从球队最近一轮的比赛入手。从每支球队前一轮比赛的比分、比赛过程中了解球队...

体彩·竞彩世界杯战报|姆巴佩梅开二度,法国2:1力克丹麦

体彩·竞彩世界杯战报|姆巴佩梅开二度,法国2:1力克丹麦

  北京时间27日凌晨0点,世界杯小组赛D组第2轮在多哈974球场打响,由法国对阵丹麦。凭借姆巴佩的梅开二度,法国队最终2:1力克对手。   据Opta统计,两队历史交手16次,法国8胜2平6负稍占优势。这也是法国和丹麦在2022年的第三次交手,最近2次比赛都出现在今年的...

新将无法作战?足球比分网德甲战队拜仁八年首次无缘欧冠

新将无法作战?足球比分网德甲战队拜仁八年首次无缘欧冠

曾几何时,德甲也在欧冠风光过。2012-2013赛季,德甲甚至在欧冠和欧联双线完成7支参赛球队全部小组赛晋级的壮举。而且在那个赛季,拜仁还在老帅海因克斯带领下,实现了“三冠王”的里程碑式突破。之后的2013-20...

世界杯谈笑风生指南 | 足球比赛的历史和规则

世界杯谈笑风生指南 | 足球比赛的历史和规则

2022卡塔尔世界杯已经开始了。2010年,卡塔尔获得了2022年世界杯举办权,其也成为第一个承办这项足球盛宴的中东国家。 这是世界杯首次在海湾地区举办,也是第一次在北半球冬季进行比赛。 那么足球是什么?足球基本规则有哪些?今天就来一起了解下足球吧。 足球...