世界杯抽签分组背后的数学问题
世界杯抽签分组背后的数学问题
每届世界杯开始之前,除了赛程、阵容和夺冠热门,还有一个很受关注的环节:小组抽签。
在观众眼里,抽签似乎是一件很简单的事:几位嘉宾站在台上,从不同的罐子里抽出球队名字,然后依次放进各个小组。这个过程看起来随机、公开、透明,也很有仪式感。
但从数学角度看,世界杯抽签并不只是“把球抽出来”那么简单。它背后涉及组合设计、概率分布、约束条件和公平性问题。László Csató 在论文 How to optimise tournament draws: The case of the FIFA World Cup (https://arxiv.org/abs/2505.13106) 中,就专门研究了世界杯抽签规则如何优化 [1]。
这篇文章的核心问题可以概括为:
世界杯抽签看起来是随机的,但它真的公平吗?
1 世界杯分组抽签
世界杯小组赛通常采用分组循环赛。参赛球队先被分入若干小组,每组内部进行单循环比赛,然后根据积分排名决定哪些球队晋级淘汰赛。
如果完全不加限制,直接随机分组,可能会出现两个问题。
第一,强队可能集中到同一个小组。比如几支世界排名很高的球队被分在一起,而另一个小组整体实力较弱。这样会导致各组竞争难度差异过大,影响晋级公平性。Guyon 对 2014 年世界杯抽签的研究就指出,抽签规则可能造成小组实力不平衡,从而影响赛事公平性 [2]。
第二,同一大洲球队可能频繁相遇。世界杯是世界性赛事,组织者通常希望小组赛尽量多出现跨洲对决,而不是让同一大洲的球队过早相遇。毕竟,同洲球队在预选赛、洲际赛事中已经经常交手,世界杯更强调不同足球文化之间的碰撞。
因此,世界杯抽签并不是完全随机,而是带有规则的随机。这些规则大致服务于三个目标:
平衡性:每个小组实力尽量接近;
透明性:抽签过程要能被观众看懂;
公平性:所有合法分组结果应当尽量等概率出现。
问题在于,这三个目标并不总是兼容。尤其是在加入地理大洲回避规则之后,抽签就会从一个简单随机过程,变成一个带约束的随机分配问题。
2 球队分档和地理回避原则
为了保证各组实力大致均衡,世界杯通常会使用“分档”或“种子队”制度。
以 2018 年和 2022 年世界杯为例,32 支球队被分成 4 个档次,每档 8 支球队。第 1 档通常包含东道主和排名最高的强队,第 2 档包含接下来排名较高的球队,以此类推。抽签时,每个小组从每个档次中各抽出一支球队。
这样做的目的,是避免一个小组里同时出现太多强队,也避免另一个小组过弱。
除了分档,世界杯还设置了地理回避规则。按照 FIFA 在 2018 年和 2022 年世界杯抽签中的规则,论文将这些地理限制概括为五类约束 [1][5]:
A:每组最多只能有一支亚洲足联 AFC 球队;
B:每组最多只能有一支非洲足联 CAF 球队;
C:每组最多只能有一支中北美及加勒比足联 CONCACAF 球队;
D:每组最多只能有一支南美足联 CONMEBOL 球队;
E:每组必须有 1 到 2 支欧洲足联 UEFA 球队。
到了 2026 年美加墨世界杯,还加入了一个新的“强队路径回避”设计:FIFA 根据抽签前的世界排名,将排名最高的4支球队分散到不同的淘汰赛路径中,使它们在正常取得小组第一的情况下,尽量不会过早相遇:例如当时世界排名前2名的阿根廷和西班牙,只要分别取得各自小组的第一,那么淘汰赛就会被分到不同半区,保证其只会在决赛或者季军赛相遇。通俗地说,这是进一步控制强队未来在淘汰赛中的潜在相遇位置。
这些规则看上去都很合理。比如,欧洲球队数量较多,如果不加限制,某些小组可能会出现太多欧洲队;而对于亚洲、非洲、南美等大洲,也希望尽量避免同洲球队过早相遇。但是,一旦加入这些约束,抽签就变成了一个数学上的带约束随机分配问题。
3 公平抽签
从数学上说,一个抽签机制是否公平,关键不在于它是不是“现场抽球”,而在于它是否接近均匀分布。
设所有满足规则的合法分组结果构成集合 \(\mathcal S\)。如果抽签是完全公平的,那么每一个合法结果 \(s\in\mathcal S\) 出现的概率都应该相等,即
\[P(s)=\frac{1}{|\mathcal S|},\quad s\in \mathcal S.
\]
这就叫均匀抽签。
注意,这里讨论的不是所有可能分组,而是所有“合法分组”。如果某个分组违反了地理回避规则,比如同组出现两支南美球队,那么它根本不属于 \(\mathcal S\)。公平性的要求是:在所有合法分组之间,每一种结果都应该等可能。
这听起来很自然,但实际操作却不容易。因为世界杯抽签不仅要公平,还要透明、好看。观众希望看到嘉宾一个球一个球地抽出来,而不是让电脑直接生成一个结果。可是,当抽签过程是一步一步进行时,前面抽出的球队会限制后面球队的可选位置。这样一来,抽签顺序、组别标签和约束条件之间就会发生复杂作用。因此
每一步看起来都随机,但整体结果并不均匀。
Roberts 和 Rosenthal 曾专门研究足球抽签中的概率偏差和修正方法,指出一些看似自然的抽签机制并不能保证所有合法结果等概率出现 [3]。Csató 后续关于世界杯抽签公平性的研究也进一步表明,抽签顺序和具体机制会影响球队之间的相遇概率 [4]。
四、Skip 机制
2018 年和 2022 年世界杯使用的是一种被称为 Skip mechanism 的抽签机制。Guyon 曾在讨论 2018 年世界杯抽签改革时介绍过这种机制,认为它相较 2014 年抽签已经有明显改进,但仍然不能完全消除概率偏差 [6]。
Skip 机制的大致思想是:按照档次依次抽球队。如果某支球队被抽出来后,不能放进当前小组,就跳过这个小组,把它放进下一个可行小组。
举一个简化例子。假设现在要把一支亚洲球队放入某个小组,但 A 组已经有亚洲球队了,那么它不能进入 A 组,就需要跳到 B 组;如果 B 组也不行,就继续往后找,直到找到一个不违反规则的小组。这就是 “Skip” 的含义:跳过不可行的小组。
不过,真实抽签比这个例子复杂得多。因为有时候,一个位置虽然当前看起来合法,但如果把球队放进去,后面剩下的球队就可能无法完成合法分配。论文把这种情况称为需要避免的 deadlock situation,也就是“死局”。因此,电脑不能只看当前一步,而要预判后续是否仍存在至少一个合法完成方案。
2026 年美加墨世界杯抽签中,就出现过一个经典案例。当乌兹别克斯坦被抽出时,观众原本可能会以为它会进入 I 组,因为当时 I 组已有法国和塞内加尔,表面上看并没有直接的亚洲球队冲突。但最终,抽签软件并没有把乌兹别克斯坦放入 I 组,而是跳过该组,将其分入 K 组,与葡萄牙、哥伦比亚同组。原因在于,带约束抽签不只检查“当前放进去是否立刻违规”,还要检查“这样放进去之后,剩余球队是否仍然能够完成一个合法分组”;如果某个选择会导致后续分配无解,就违反了抽签的全局可行性原则。这个结果一度让不少球迷感到困惑,但从数学上看,这正是带约束抽签的典型现象:某个小组在局部看似可行,但从后续剩余球队和整体约束来看,未必仍然可行。因此,电脑需要实时判断哪些位置真正可用,必要时就会跳过当前小组,把球队放入下一个可行小组。
因此,Skip 机制背后其实需要电脑进行可行性检查。现场看起来是嘉宾抽球,实际上后台需要算法判断哪些小组可以放,哪些小组必须跳过。这种方法的优点是:它比较透明,也比较适合电视直播。但缺点是:它不一定产生均匀分布。
5 Skip 机制为什么可能产生偏差?
Skip 机制的问题在于,它是一个顺序机制。球队是一个接一个被抽出来的,小组也是按照 A、B、C、D……这样的顺序被检查的。但是,正因为 Skip 机制是按照顺序一步步执行的,它并不保证所有合法分组结果等概率出现。
为了看清楚这一点,论文给了一个例子。假设有 6 支球队,分成 3 个档次:
Pot 1:球队 1、2;
Pot 2:球队 3、4;
Pot 3:球队 5、6。
现在要分成两个小组 A、B,每个小组从每个档次中各取一队。同时设定一个额外约束:
球队 2、4、6 中,不能有三支都在同一个小组。
如果不考虑小组名称,只看球队 1 和谁同组,那么合法结果有三种:
球队 1 与球队 3、6 同组;
球队 1 与球队 4、5 同组;
球队 1 与球队 4、6 同组。
因此,在真正均匀的合法抽签中,球队 1 和球队 4 同组的概率应该是\(\frac{2}{3}.\) 可是,如果使用 Skip 机制,从 Pot 1 抽到 Pot 3 依次进行,这个约束只有在抽到 Pot 3 时才真正发挥作用。前面的抽签过程没有提前“平均地”考虑所有合法结果。论文计算得到,在这个顺序机制下,球队 1 和球队 4 同组的概率变成\(\frac{1}{2}.\)
这就是 Skip 机制可能产生偏差的本质原因:
Skip 机制保证结果合法,但不保证所有合法结果等概率出现。
用数学语言说,设所有合法分组构成集合 \(\mathcal S\)。真正均匀抽签要求
\[P(s)=\frac{1}{|\mathcal S|},\quad s\in \mathcal S.
\]
但 Skip 机制产生的是另一个概率分布。某些合法结果可能有更多“抽签路径”通向它,某些合法结果则更少,因此最终概率不一定相同。
论文用两种指标衡量这种偏差。设 \(p^U_{ij}(\mathcal C)\) 表示在约束集合 \(\mathcal C\) 下,如果使用真正均匀抽签,球队 \(i\) 和球队 \(j\) 被分到同一组的概率;设 \(p^S_{ij}(\mathcal C)\) 表示使用 Skip 机制时,两队同组的概率。
如果这两个概率差得很大,就说明 Skip 机制对这两支球队之间的相遇概率造成了扭曲。
论文定义平均偏差:
\[\Delta(\mathcal C)=100\cdot \frac{\sum_{i,j}|p^U_{ij}(\mathcal C)-p^S_{ij}(\mathcal C)|}{\#\{(i,j):p^U_{ij}(\mathcal C)>0\}},
\]
以及最大偏差:
\[\Omega(\mathcal C)=100\cdot \max_{i,j}|p^U_{ij}(\mathcal C)-p^S_{ij}(\mathcal C)|.
\]
这两个指标可以这样理解:
\(\Delta(\mathcal C)\) 衡量整体平均偏差;
\(\Omega(\mathcal C)\) 衡量最严重的一对球队被扭曲了多少。
平均偏差越小,说明总体越接近均匀抽签;最大偏差越小,说明没有哪一对球队被特别严重地影响。
文章进一步考虑了另一个指标:同大洲球队在小组赛中相遇的平均次数,记为 \(\Psi(\mathcal C)\)。同洲比赛越少,跨洲对决越多,比赛多样性越强。于是,组织者面对的是一个权衡问题:
\[\min_{\mathcal C}\ \alpha\cdot 10\Delta(\mathcal C)+(1-\alpha)\cdot \Psi(\mathcal C),
\]
或者
\[\min_{\mathcal C}\ \alpha\cdot \Omega(\mathcal C)+(1-\alpha)\cdot \Psi(\mathcal C).
\]
这里的 \(\alpha\) 表示组织者更重视哪一边:
如果 \(\alpha\) 越大,说明更重视抽签公平性;
如果 \(\alpha\) 越小,说明更重视减少同洲比赛、增加跨洲对决。
所以,这篇文章指出:Skip 机制是一种透明、可操作、能保证合法性的机制,但它牺牲了严格意义上的均匀性。
6 欧洲球队规则为什么最麻烦?
论文的一个重要发现是:在五类地理约束中,最容易制造抽签偏差的是欧洲球队规则,也就是约束 E: 每个小组必须有 1 到 2 支欧洲足联 UEFA 球队。 这里需要注意,欧洲球队规则之所以麻烦,主要不是因为欧洲球队实力强,而是因为这个约束在数学结构上更复杂。
对于亚洲、非洲、中北美、南美球队,规则 A–D 的形式都是: 每个小组最多只能有一支来自该大洲的球队。这种约束本质上是“禁止同大洲球队成对出现在同一组”。比如两支南美球队不能同组,两支亚洲球队不能同组。它们主要是 上界约束,可以理解为若干个“禁止配对”。
但欧洲球队规则不同。由于欧洲球队数量太多,FIFA 不只是限制“不能太多”,还要求“不能太少”。因此约束 E 实际上包含两个部分:
\(E_1\):每组至少有一支欧洲球队;
\(E_2\):每组最多有两支欧洲球队。
也就是说,欧洲规则既有下界,又有上界:
\[1\leq \#\{\text{某组中的 UEFA 球队}\}\leq 2.
\]
这比“最多一个”复杂得多。
这时,抽签程序必须保证 8 个小组最后都能分到欧洲队。如果前面几个小组消耗了太多欧洲队,后面某些小组可能就无法满足“至少一支欧洲队”的要求;如果某些小组已经有两支欧洲队,后面欧洲队又不能再进入这些小组。
因此,约束 E 会让抽签产生更多“当前可行但后续不可行”的情形。电脑不仅要判断眼前有没有超过 2 支欧洲队,还要判断后面是否还来得及给所有小组补足欧洲队。这正是 Skip 机制最容易产生路径依赖和概率偏差的地方。
论文的附录还对 2018 年世界杯中的欧洲规则做了具体计算。2018 年世界杯共有 14 支欧洲队参赛,分布在 4 个档次中,其中第 1 档有 6 支,第 2 档有 4 支,第 3 档有 3 支,第 4 档有 1 支。作者把约束 E 拆成 \(E_1\) 和 \(E_2\) 分析后发现,在随机无约束抽签中:
\[P(E_1)\approx 56.41\%,~P(E_2)\approx 6.665\%,~P(E)\approx 6.059\%.
\]
也就是说,在 2018 年世界杯的队伍构成下,如果先完全随机分组,再检查是否满足欧洲规则,那么只有大约 \(6.059\%\) 的结果能同时满足“每组至少一支欧洲队”和“每组最多两支欧洲队”。这说明约束 E 非常强。它大幅缩小了合法分组空间,也让顺序抽签机制更容易产生非均匀性。论文的模拟进一步表明:如果不使用约束 E,Skip 机制产生的偏差较小;一旦加入约束 E,平均偏差 \(\Delta(\mathcal C)\) 和最大偏差 \(\Omega(\mathcal C)\) 都会显著上升。
作者还指出,约束 E 对 Skip 机制特别困难,因为它允许同一集合中的多支球队进入同组,但又不能超过上限;相比之下,A–D 这类“最多一支”的规则更接近简单的禁止配对,处理起来更稳定。所以,欧洲球队规则最麻烦的根本原因是:
它不是单纯的“不能同组”,而是同时要求“每组至少有欧洲队”和“每组不能有太多欧洲队”。
这类上下界约束会强烈影响后续分配空间。某个早期选择可能立刻看不出问题,但会让后面无法完成合法分组。Skip 机制为了避免死局,就必须不断跳过某些小组,由此带来更强的顺序效应和概率偏差。这也说明:规则确实减少了同洲内战,但也可能在抽签概率上制造新的不公平。
7 东道主预先分到 A 组为什么会增加不公平?
世界杯抽签还有一个传统做法:东道主通常会被直接放进 A 组。这在赛程安排上很方便。东道主踢揭幕战,所在小组叫 A 组,也符合观众习惯。但论文指出,从概率角度看,提前把东道主固定在 A 组会额外增加抽签偏差。
原因仍然和 Skip 机制的顺序性有关。在 Skip 机制中,A 组、B 组、C 组这些标签并不是纯粹的名字。程序检查小组时,会按照字母顺序寻找可行位置。因此,哪个小组叫 A,哪个小组叫 B,会影响后面球队被跳过或被放入的位置。如果东道主一开始就被固定在 A 组,那么 A 组从抽签开始就变成一个特殊小组。后续球队进入各组的概率,会受到“东道主已经在 A 组”这一事实影响。
论文中特别指出:如果东道主被自动放入 A 组,那么它与任意一支第 2 档球队同组的概率在 Skip 机制下会被固定为\(\frac{1}{8}=12.5\%.\)表面上看,这似乎很公平,因为第 2 档有 8 支球队,每支球队与东道主同组的概率都一样。
但问题在于,在真正均匀的合法抽签中,这些概率本来就不一定都等于 \(12.5\%\)。原因是地理约束会影响不同球队之间的可配对关系。比如第 1 档和第 2 档中可能都有南美球队,而两支南美球队不能同组。这样一来,不同第 2 档球队与不同第 1 档球队之间的可行性并不完全相同,均匀合法抽签下的同组概率也不必完全相同。换句话说,真正的公平不是“东道主对每支第 2 档球队都是 \(12.5\%\)”,而是“东道主和每支球队的相遇概率应该等于均匀合法抽签下的概率”。
这正是论文用 \(p^U_{ij}(\mathcal C)\) 和 \(p^S_{ij}(\mathcal C)\) 比较的原因。如果 Skip 机制下的概率 \(p^S_{ij}(\mathcal C)\) 偏离均匀抽签概率 \(p^U_{ij}(\mathcal C)\),就说明它产生了扭曲。
作者认为,东道主其实没有必要在抽签开始前就被固定到 A 组。因为小组名称可以在抽签结束后再调整。也就是说,可以先让东道主像其他第 1 档球队一样正常参与抽签,等所有分组结束后,再把东道主所在的小组命名为 A 组。两者在赛程包装上几乎没有区别,但在概率结构上差别很大。
前一种做法会让 A 组从一开始就具有特殊地位,并把 Skip 机制对组别标签的敏感性集中到东道主身上。后一种做法则把东道主所在小组随机化,等抽签结束后再重新命名,从而消除由组别标签造成的额外偏差。
论文的模拟结果显示,这个简单修改能明显降低东道主相关的抽签扭曲。对于 2018 年世界杯,作者方案使俄罗斯的相关偏差减少约 \(85\%\);对于 2022 年世界杯,使卡塔尔的相关偏差减少约 \(44\%\)。同时,它基本不会恶化其他球队的处境。
九、总结
这篇文章真正想说明的是:一个抽签过程即使公开透明,也未必在数学上公平。
很多人会把“现场抽球”等同于“随机”,再把“随机”等同于“公平”。但数学告诉我们,这三个概念并不完全相同。现场抽球,只说明过程看起来透明;随机抽球,只说明某些局部步骤有随机性;真正公平,还要求所有合法结果的概率尽量一致。
如果一个抽签机制因为约束条件、检查顺序、跳过规则和组别标签而系统性地偏向某些结果,那么它就不是严格意义上的均匀抽签。这篇文章把世界杯抽签拆成一个数学优化问题,研究了 32 种可能的地理约束组合,并比较它们在两方面的表现:
抽签是否接近均匀;
小组赛是否尽量避免同洲对决。
最后得出的结论是:世界杯抽签规则的设计,本质上是在公平性和比赛吸引力之间做权衡。但是:
1. 地理回避规则有它的合理性,但付出了计算上的代价;
2. 东道主预分到 A 组看似自然,却可能增加概率扭曲;
3. Skip 机制虽然透明可操作,但并不保证均匀分布。
世界杯是足球比赛,但世界杯赛制本身也是一个数学问题。小组怎么分,抽签按什么顺序进行,都会影响球队的晋级概率和比赛公平性。
对于普通观众来说,抽签仪式可能只是一场热闹的电视节目;但对于数学家和运筹学研究者来说,它是一个包含约束、概率、模拟和优化的复杂系统。足球场上的胜负由球员决定。但球队通往球场的路径,有时早在抽签规则里就已经被悄悄改变了。
参考文献
[1] Csató, L. How to optimise tournament draws: The case of the FIFA World Cup. arXiv:2505.13106, 2026.
[2] Guyon, J. Rethinking the FIFA World Cup final draw. Journal of Quantitative Analysis in Sports, 2015.
[3] Roberts, G. O., and Rosenthal, J. S. Football group draw probabilities and corrections. The Canadian Journal of Statistics, 2024.
[4] Csató, L. The fairness of the group draw for the FIFA World Cup. International Journal of Sports Science & Coaching, 2025.
[5] FIFA. Draw procedures for the FIFA World Cup 2018 and FIFA World Cup Qatar 2022. 2017, 2022.
[6] Guyon, J. Pourquoi la Coupe du monde est plus équitable cette année. The Conversation, 2018.