您当前的位置:首页 > 学习 > 阅览室

趣题:均匀分布且和为常数的n个变量

时间:11-21来源:作者:点击数:
城东书院 www.cdsy.xyz

不知道大家有没有幻想过,数学中是否存在这样一个牛B的问题,发表出来后十几年硬是没有一个人解开;后来某人惊奇地发现,它有一个极其精妙的解答,整个解决过程只需要几句话就能说清楚,但它实在是太巧妙了,这么多年就没有任何人想到。最近我就遇到了这样的事情。3月份UyHiP的题目(http://www.brand.site.co.il/riddles/200903q.html)非常有趣,整个证明几句话就完了,但想到解法的却只有一人。

题目描述也极其简单。对于哪些n,存在一种生成n个随机变量的算法,使得它们在0和1之间均匀分布,且它们的和是一个常数?更进一步,如果这n个变量中任意k个都相互独立,满足要求的k最大是多少(表示成关于n的函数)?

当然,这道题目我也没想出来。答案公布前,我思考了很久,最后还是放弃了。显然n是偶数时这样的算法是存在的,例如当n=6时,只需要先独立地选取3个随机变量X_1, X_2, X_3,然后令X_4 = 1 – X_1,X_5 = 1 – X_2,X_6 = 1 – X_3即可。这可以保证6个变量之和总为3,且它们均匀地分布在[0,1]区间里。但是当n是奇数时,满足要求的算法就未必存在了。例如当n=3时,不妨让X_1和X_2随机取,X_3等于1.5 – X_1 – X_2。这种算法似乎很和谐,问题就出在X_3有可能不在0和1之间。那么,重复执行该操作直到返回一个落在[0,1]里的X_3呢?这样的话变量又不是均匀分布的了,这将让变量更容易取到中间去,因为X_1和X_2太小或太大往往算不出合法的X_3(下图是Mathematica模拟的结果)。我试图从“n个变量的和的期望值是n/2”出发,证明和为1.5的3个变量不可能均匀分布在0到1之间。不过,最终还是没有找到突破口。

在上面n为偶数的情况下,有n/2对不独立的变量。是否有可能每一对变量都互相独立呢?很多人估计想,这怎么可能,既然总和要求相等,各个变量之间必然会相互依赖、相互限制。而事实上,如果这些变量可以由第三方变量同时生成出来,上述矛盾很可能解决。一个经典例子就是,投掷一颗骰子,设结果为d,则变量x = d mod 2,变量y = d mod 3,虽然它们看似“有联系”,但显然它们是独立的,不管x等于多少,y=0、y=1、y=2的几率都是相等的,它的取值与x没有任何关系。从概念上说,有P(x)·P(y) = P(x∩y),这足以说明两者是独立的。巧妙利用这种关系,题目要求很可能达到。

从题目上看来,不单是变量“两两”独立,即使任意三个变量互相独立、任意四个变量互相独立也是有可能的。我猜想k < n/2,不过也没有能证明到。 今天我看到答案,一下子就傻了……这么简单的解法,两个月了我居然一直没想到。 事实上,我的整个大方向都完全错了。除了n=1显然不行,其它情况下都存在均匀分布且和为常数的随机变量。当n=2时,取随机变量X_1,再令X_2 = 1 - X_1,这两个变量显然符合要求。当n=3时这个办法虽然行不通,但我们有很多别的办法。最巧妙的一种办法就是选取3个三进制小数使得它们同一位上的数各不相同。具体地说,从1开始枚举i,每次把0、1、2三个数字随机分配给X_1, X_2, X_3,作为它们各自小数点后的第i位。三个变量显然都均匀分布在[0,1]上,且它们的和总为1.1111111...,即十进制中的1.5。那么,当n>3时这个办法还管用么?其实我们根本不必考虑这个,因为对于更大的n,我们只需要把变量两个两个分成一组,并分别套用n=2的算法;若最后还剩了3个变量,再套用n=3的算法就是了。这样,对所有n>1的情况我们都给出了一种生成满足要求的变量的算法。

更令人抓狂的是,对于后一个问题,事实上连k=2都办不到,其证明简单得实在是出人意料。考虑

X_1 + X_2 + X_3 + … + X_n = 常数

等式右边的方差显然为0。假设变量两两独立,则和的方差就等于方差的和。单个变量的方差为,即1/12。n个变量之和的方差即为n/12。等式两边方差不等,矛盾。

城东书院 www.cdsy.xyz
方便获取更多学习、工作、生活信息请关注本站微信公众号城东书院 微信服务号城东书院 微信订阅号
推荐内容
相关内容
栏目更新
栏目热门
本栏推荐