自旋的城市- - - - - -

精神病学临床试验报告中的造假现象很普遍

超过一半的样本在报告摘要中做了奉承的调整。

这些药完全有效。我们发誓。
扩大 /这些药完全有效。我们发誓。

不仅仅是长篇新闻报道和愤怒的网络评论会让读者发出“tl;dr”的感叹。研究论文也会引发这种情绪,因为科学家们被大量的新研究成果淹没,很难跟上进度。根据牛津大学精神病学家迈克尔·夏普的说法,“每个人都被信息淹没了。”

研究论文在信息丰富的文章“摘要”中对其内容进行了简要的总结——这通常是付费期刊中唯一公开的文本。时间紧迫的研究人员可能会依赖摘要而不是投资阅读冗长的论文,但这些摘要并不总是可靠的。本周发表在该杂志上的一篇论文BMJ循证医学他们发现,在他们分析的116篇精神病学和心理学文章中,有一半包含了某种让结果看起来比实际更好的说法。

夏普说:“这些发现引起了一个重大关注告诉科学媒体中心“尤其是读者可能只根据摘要得出结论,而没有对整篇论文进行批判性评价。”

科学的遮瑕膏

随机对照试验(rct)应该按照一个极其严格的标准进行。由于风险如此之高,证据的质量也需要很高。患者被随机分配接受试验治疗或安慰剂或现有治疗的对比治疗。随机对照试验旨在预先明确他们计划研究什么,以及他们将如何分析结果,报告他们发现的每一件事,而不是挑选最讨人喜欢的结果。

不幸的是,仍然有一些花招可以玩。摘要和标题都提供了选择性报道的机会,可以粉饰一项没有达到预期结果的研究。为了评估这种情况有多普遍,一组研究人员查阅了临床心理学和精神病学文献,寻找那些对他们开始研究的主要问题没有显著结果的随机对照试验。

在报告结果的方式上有一些灵活性,因为研究论文通常包含了相关数据的集合。例如,一项关于特定饮食的研究可能主要是跟踪减肥和胰岛素抵抗,研究人员会找出试验的技术细节——比如根据这些目标应该包括多少患者。但该试验也可以跟踪生活质量作为次要终点,本质上是一个有趣的附加项目,没有主要目标那么多的经验重要性。

一项试验也可能以显著和不显著的结果结束,而“不显著”在这里有特殊的含义。这不仅仅是因为这些研究发现了一个可能没有多大意义的小结果。相反,他们的发现并非如此统计学上有意义的:治疗组和对照组之间的任何差异都可以很好地用随机机会来解释。

旋转的意义

研究人员找到了116篇符合要求的论文,然后对它们的摘要进行了旋转评级。最常见的策略是使用抽象来吸引人们对那些重要的主要终点的注意,而不是那些不重要的。通常也会声称一种治疗是有益的,因为次要终点是显著的。

一系列不太常见的技巧都涉及一些技巧,使该报告能够宣称成功,即使试验的主要目标没有实现。有一篇论文甚至强调了治疗组和对照组结果之间的差异——尽管统计检验清楚地表明,这种差异可以很容易地用随机概率来解释。总体而言,样本中56%的论文包含某种形式的旋转。

目前还不清楚阅读科学文献的临床医生是否会受到这种说法的影响。研究人员指出,有证据表明医生通常只阅读摘要,也有一些实验工作在研究摘要中的旋转是否真的会影响医生的观点,但结果好坏参半。

这个分析集中在心理学和精神病学上,但没有理由认为问题局限于这些领域。“试图通过阅读摘要来应对洪水可能是一个错误,”夏普说。“作者、同行审稿人和期刊编辑都需要更加注意标题和摘要的准确性,以及主要报告。”

《BMJ循证医学》,2018。DOI:10.1136 / bmjebm - 2019 - 111176对必须).

你必须置评。

通道Ars Technica