作者 | 李晨阳
6月20日,Science杂志刊发了一篇题为Civic honesty around the globe的论文。
其中得出的在调查的国家中“中国公民诚信垫底”的结果,引发广泛关注和争议。
该研究的实验设计是这样的:
4名来自美国和瑞士的研究人员在40个国家的355个城市,撒下了17303个钱包。研究助理假扮拾金不昧者,将这些钱包上交到酒店、银行、博物馆、邮局、剧院等公共机构的工作人员手中,看有多少人会根据名片上提供的电子邮箱(名片上没有电话和地址),主动联系失主。
在这份所谓的“诚信排行榜”上,中国位列倒数第一,排在肯尼亚、秘鲁等国之后。
这篇论文的通讯作者为美国密歇根大学信息学院的Alain Cohn和瑞士苏黎世大学经济学教授Michel Maréchal,作者还包括盐湖城犹他大学管理系的David Tannenbaum和苏黎世大学经济系的Christian Lukas Zünd。
Science重点推荐了该论文,并专门为这项开展了10年的研究召开了电话会议。
不过,很多人在查看论文后认为,上述图表只能说明在钱包里没有钱的情况下,中国人主动联系失主的行为频率比较低。
对于上述图表能否真的反映论文标题所提及的中国或者其他国家公民的“诚信”问题,不少人表示质疑。同时,这项研究的实验设计也引发争议。
争议点主要在4个方面。
1. 不联系失主=不诚信?
论文的数据结果显示,在钱包里没有钱的情况下,中国人主动联系失主的行为频率最低;当钱包里多出49元人民币时,中国人联系失主的频率上升,位列倒数第五。
如果只是客观展示这些数据,并没什么不妥。
然而,这篇论文将“联系失主”和道德诚信直接挂钩,并且在文中多次提到“诚信率”“各国公民诚信程度的巨大差异”。
对于这一点,很多人表示质疑。
理由是:作为酒店、剧院等公共场所的服务人员,在接到这样一个钱包时(内含较少金钱和少量个人物品),可能会尝试直接寻找失主,可能会将钱包递交失物招领处,可能会将它留在前台等待失主主动前来。
这些选择反映了其工作态度、工作习惯、工作模式,最多上升到职业素养问题,但只要他没有将这些钱据为己有,就不能算“不诚信”的行为。
2. 目标研究对象和实际研究对象之间出现偏差
很多人都注意到,这项研究的目标研究对象和实际研究对象之间出现了偏差。
科研人员的目的是研究“公民诚信问题”,但事实上选择的被试者都是有着明确职业背景的几类机构工作人员。
不少人认为,严格来说,这项研究得出的结果并不能代表“公民”的诚信状况,最多能反映上述机构从业人员的业务水平和职业素养。
在Science举行的电话会议中,论文作者如此解释:
我们实验的一个关键特征是我们没有把钱包掉在街上,而是把它们交给了在公共机构工作的人,包括酒店、银行、文化机构、邮局,以及警察局等公共机构工作的人。因此,与其他依靠路人来寻找和捡钱包的研究相比,这让参与研究的人对我们来说有了更多的可控性。
也就是说,为了实验的可控性(或者也可以说“可操作性”和“效率”),作者“适当”地牺牲了一部分严谨性。
3. 样本不足
针对中国的研究中,研究者在北京、成都、广州、杭州、上海、深圳、天津、西安8个大城市,选取了400名机构工作人员进行测试。
于是,有人质疑,这个样本量足够展现中国人的“诚信率”吗?
下面看看部分国家的样本/人口比示例。
国家 | 人口 | 有效样本数 |
法国 | 6500万 | 802 |
英国 | 6600万 | 1132 |
阿根廷 | 4400万 | 400 |
阿联酋 | 950万 | 400 |
中国 | 14亿 | 400 |
尽管样本数量差异跟部分地区的附加实验有关,但在统计层面,样本数与总人口的比例绝非没有意义。
就在这项研究中,作者特别强调,每个城市分配的钱包数是根据相对人口规模确定的, 以“给更多人口的城市以更大的权重”。
于是,有人质疑,那么在更宏观的研究层面上,是否也应该给中国匹配更大的样本量,以得到更有普适性的结果呢?
4. 情境失真
研究中假扮“拾金不昧”者的研究助理全部来自13名德语区大学生,上交钱包时也运用英语交流。
尽管论文中评估了每个被试者的英语程度和对当时情况的理解程度,并在数据处理中考量了这些因素。但是不难想象,这些“异域因素”还是会对实验结果产生巨大影响。
下面是这项研究提到的钱包和名片。很多人认为,看到这样的钱包,真的很难将其和一个焦灼不安的失主联系起来。这或许对于上交钱包的意愿也有不小的影响。
近乎简陋的透明卡包,少量零钱、硬币,一把孤零零的钥匙(没有钥匙环和钥匙链)
信息简单到异常的名片,没有提供单位、职务、电话、地址等信息
除了这些,还有人反馈了其他可能影响实验结果的因素:
中国人缺乏使用电子邮箱的习惯
人口密度大、顾客流量大导致工作人员难以一一应对
习惯上更倾向于等待失主上门寻物
其他文化差异问题
当然,对其中不少因素,作者都在论文中处理和讨论过。因此,至少看上去,上述文化心理因素并不能解释“各国公民诚信程度的巨大差异”。
作为一篇历时10年完成、经过同行评议且发表在国际顶尖学术期刊上的论文,其研究价值可圈可点。
不过,一篇论文能在短时间内引发如此多的争议,暴露出其本身存在不少问题。
甚至有人表示,对于这种从实验设计角度就不算严谨的报告能登上国际顶级期刊,深感失望。
关于这篇论文,有人总结道:在一些关键的问题上,研究人员偷工减料的实验设计,最终形成了哗众取宠的研究结论。
相关论文信息:
http://dx.doi.org//10.1126/science.aau8712
http://science.sciencemag.org/content/suppl/2019/06/19/science.aau8712.DC1
合作事宜:market@stimes.cn
投稿事宜:tougao@stimes.cn