P<0.05不管用了？！这篇17分文章建议将P值进行多分类！

R语言和统计2021年12月29日

小编前几天阅读了一篇发表于今年11月份的文章，名为"Rewriting results sections in the language of evidence"，此文章建议摒弃在常规的零假设显著性检验中武断地将P值进行二分类(p < 0.05)的做法，而是支持将P值分成多个类别，从而反应不同的证据强弱。

P值从被提出至今，约有百年历史，一直争议不断。

在实践中，科学论文是否可以被发表很大一部分取决于P值是否小于0.05！由于所压的赌注实在太大，随之而来的则是撒网式分析、选择性报道，基于P值选择模型，以及先得到结果后产生“假说”等行为，从而造成井喷式的假阳性研究结果和可重复性危机。

基于2021年1月份8个生态学和进化领域研究期刊中的论文，原文作者做了一项综述调查，发现共有92%的论文采用基于P值的二分类法，97.3%的研究使用了“显著性”语句汇报研究结果。而其他领域，比如医学，情况应该也类似。

显然，如今的现状是：杂志社以及研究人员都有意无意地将P值是否小于0.05作为衡量某一个科学发现是否存在，或者说是否有“统计学显著性”的标准。

而当下的这种风气遭到传统统计理论家们的强烈抨击！认为如今的状况是绝对不可接受的，完全将P值的真实含义搞错了！感慨“礼崩乐坏”，一代不如一代！

但原文作者认为，既然现状如此，只能“两害相权取其轻”，将P值从二分类转换成多分类是比较符合实际的做法！论文中作者的建议如下所示：

来源：文献[1]的Figure 1

上述的做法虽违背了P值本身的含义，但是作者辩护道：一些直接可以评估证据的指标，比如贝叶斯因子，与P值存在强相关性！

作者也给出了一些例子，关于如何将传统的统计学结果修改成新推荐的方法，如下表所示：

来源：文献[1]的Table 1

以及下表：

来源：文献[1]的Table 2

既然过去几十年由“激进的”完美主义者发动的革命并没有获得胜利的果实(比如，取缔P值)，那就让“保守的”务实主义者从现实出发试一试也未尝不可！

这篇论文注定会产生争议，让子弹飞一会，剩下的交给时间。

好啦，今天的内容就到这里。

参考文献

[1]. Stefanie Muff et al. Rewriting results sections in the language of evidence, Trends in Ecology & Evolution, 2021.11

上一篇：博士招生|奥斯陆大学招收2名全奖博士生下一篇：人耳的听觉特征和响度

最热资讯

热门标签