您当前的位置:首页 > 新闻中心 > 行业新闻
P<0.05不管用了?!这篇17分文章建议将P值进行多分类! R语言和统计2021年12月29日


小编前几天阅读了一篇发表于今年11月份的文章,名为"Rewriting results sections in the language of evidence",此文章建议摒弃在常规的零假设显著性检验中武断地将P值进行二分类(p < 0.05)的做法,而是支持将P值分成多个类别,从而反应不同的证据强弱。

P值从被提出至今,约有百年历史,一直争议不断。

在实践中,科学论文是否可以被发表很大一部分取决于P值是否小于0.05!由于所压的赌注实在太大,随之而来的则是撒网式分析、选择性报道,基于P值选择模型,以及先得到结果后产生“假说”等行为,从而造成井喷式的假阳性研究结果和可重复性危机。

基于2021年1月份8个生态学和进化领域研究期刊中的论文,原文作者做了一项综述调查,发现共有92%的论文采用基于P值的二分类法,97.3%的研究使用了“显著性”语句汇报研究结果。而其他领域,比如医学,情况应该也类似。


显然,如今的现状是:杂志社以及研究人员都有意无意地将P值是否小于0.05作为衡量某一个科学发现是否存在,或者说是否有“统计学显著性”的标准。

而当下的这种风气遭到传统统计理论家们的强烈抨击!认为如今的状况是绝对不可接受的,完全将P值的真实含义搞错了!感慨“礼崩乐坏”,一代不如一代!

但原文作者认为,既然现状如此,只能“两害相权取其轻”,将P值从二分类转换成多分类是比较符合实际的做法!论文中作者的建议如下所示: 

来源:文献[1]的Figure 1

上述的做法虽违背了P值本身的含义,但是作者辩护道:一些直接可以评估证据的指标,比如贝叶斯因子,与P值存在强相关性!

作者也给出了一些例子,关于如何将传统的统计学结果修改成新推荐的方法,如下表所示:  


来源:文献[1]的Table 1

以及下表: 

来源:文献[1]的Table 2

既然过去几十年由“激进的”完美主义者发动的革命并没有获得胜利的果实(比如,取缔P值),那就让“保守的”务实主义者从现实出发试一试也未尝不可!

这篇论文注定会产生争议,让子弹飞一会,剩下的交给时间。


好啦,今天的内容就到这里。



参考文献

[1]. Stefanie Muff et al. Rewriting results sections in the language of evidence, Trends in Ecology & Evolution, 2021.11



分享到:

最热资讯

热门标签