我在学校时,时不时会有人闯进宿舍,给宿舍里的每个人发一张调查表邀请大家填写。如果我不是很忙的话,通常还是很乐意填写的。不过,有时我很悲哀的发现,很多调查表的设计都很缺乏科学性。设计一张合理的调查表并不是一件容易的事情,你需要综合考虑各方面的因素。例如,假如你需要在调查表中问一个极度隐私的问题,尽管你在调查表上再三强调你们的保密措施,但你真的指望所有人都能够如实地回答吗?你真的指望会有人在“我不是处男/处女”或“我有同性恋倾向”前面打一个勾然后把表递到问卷回收人的手中吗?
让我们考虑这样一个问题:你希望在调查表上问一个隐私问题。为了方便起见,假设这个问题只有“是”和“否”两个选项。有什么方案能够绝对地保证个人隐私完全不可能被泄露,让每个人都能够放心地填写,并且问卷回收之后能够得到一个准确的统计结果?
在问卷上要求每个人准备一枚硬币(或者叫问卷发放人给每个人发一枚一块钱的硬币,顺便也当作酬谢)。对于指定的隐私题目,请填写人投掷一次硬币:如果正面朝上,则如实填写个人的真实情况;如果反面朝上,那么就再投掷一次硬币,正面就填“是”,反面就填“否”。当然,若第一次投掷硬币为正的话,填写人完全可以假装再投一次硬币来掩人耳目。这样,别人永远不知道你在“我不是处男/处女”前面打了勾是因为你真的不是还是因为那个答案是投掷出来的。
假设回收后有效问卷有M份,其中该问题答“是”的有N个人。如实填写了该问题的人平均有M/2个;在另外M/2人中,平均有M/4人答的“是”。因此,我们所需要的最终结果应该为(N-M/4)/(M/2)。
把这个算法写在问卷上,让大家知道问卷调查结果将如何统计,以便让大家严格遵守该问题的填写方法。
来源:http://www.cut-the-knot.org/Probability/EmbarrassingQuestion.shtml