一年600篇的“论文流水线”:当FAERS数据库沦为学术灌水的温床

日期:2026-04-14 14:50:04 / 人气:6




2026年初,学术监督网站Retraction Watch的一则撤稿通报,揭开了学术圈光鲜外表下的冰山一角。这不仅仅是关于一篇GLP-1减肥药论文的统计错误,更指向了一场针对公共数据库的系统性“薅羊毛”运动——在短短几年内,基于FDA不良事件报告系统(FAERS)的论文数量从每年百篇激增至600篇。这股狂潮,正在制造一种全新的学术垃圾。

一、 从“纠错”到“灌水”:两种截然不同的失败

个案的胜利:IJO的撤稿
2026年2月,《国际肥胖杂志》(IJO)撤回了一篇关于GLP-1减肥药联合用药的论文。该研究声称联合用药可额外减重4%,但期刊统计编辑David Allison发现其核心统计逻辑根本无法支撑结论。尽管所有作者均不同意撤稿,但在严格的调查程序后,论文最终被撤回。这是一个理想的结局:纠错机制生效,学术诚信得到了捍卫。

系统的溃败:600篇的洪流
然而,当问题从“一篇坏论文”变成“六百篇无意义的论文”时,防线崩溃了。Retraction Watch的调查显示,从2021年到2024年,基于FAERS数据库的论文数量呈指数级增长。这并非研究热情的自然高涨,而是一场精心策划的“论文工厂”作业。

二、 揭秘“灌水模板”:没有假数据,只有“无问题”

这些论文为何能如此高产?因为它们遵循了一套标准化的“灌水模板”,完美规避了传统学术不端的红线。

1. 数据源:免费的“金矿”
FAERS是美国FDA维护的公共数据库,收录了数千万条药品不良事件报告。它是免费的、开放的、且体量巨大。对于急于发文的研究者而言,这是一个无需实验成本、无需伦理审批的“富矿”。

2. 方法论:自动化的P值狩猎
研究者不再需要提出明确的临床假说。流程变成了:选择一个药物 -> 扔进FAERS数据库 -> 运行“不成比例分析”(Disproportionality Analysis)-> 寻找统计显著的信号。
法国药理学家Charles Khouri指出,这本质上是P值操纵(P-hacking)。在一个包含数百万种药物和事件组合的数据库中,通过反复试验不同的变量组合,总能“撞”出几个看似显著的P值。

3. 核心病灶:“没有研究问题”
这是最致命的指控。正常的科研始于疑问,终于解答。而这些论文始于数据,终于统计结果。它们往往缺乏对药物机制的基本理解,甚至产出荒谬的结论——例如有论文“发现”治疗肺动脉高压的药物西地那非与肺动脉高压存在关联,这种“雨伞和下雨天的关联”在逻辑上毫无价值。

三、 谁在驱动这辆战车?

地理画像:爆发式的增长
数据显示,2019年至2025年间,发表在权威期刊上的FAERS论文中,近80%的作者隶属于中国机构。这种从“完全缺席”到“绝对主导”的转变,暗示着背后有系统性的驱动力。个别研究者单人产出数十篇此类论文,且大多发表在影响因子尚可的期刊上。

技术加持:AI时代的论文工厂
英国萨里大学学者Matt Spick的研究表明,这不仅是勤奋的结果,更是技术的产物。结合生成式AI工具,FAERS这类公共数据库正在催生一条低成本、高产出的论文流水线。数据免费下载,分析脚本自动化,论文格式模板化。唯一的限制,变成了投稿速度。

四、 期刊的反击与无奈

面对洪水般的低质投稿,期刊被迫筑起高墙。

•   《药物安全专家观点》:直接颁布禁令,不再接受未经邀请的FAERS不成比例分析稿件。

•   《药理学前沿》:引入新规,要求所有基于公共数据库的研究必须提供独立的外部验证。

这些措施立竿见影,大量稿件被拒。但一个更棘手的难题摆在眼前:如何处理已经发表的论文?

答案是:几乎无能为力。

截至报道时,仅有2篇此类论文被撤回。原因在于,这些论文虽然在科学意义上“无用”,但在技术层面“不假”。它们使用了真实的数据,运行了真实的统计软件,输出了格式完整的统计指标。现有的撤稿机制主要针对数据造假、图像篡改等明确的不端行为,对这种“无问题研究”束手无策。

五、 隐形杀手:无害却有毒

这些“无用但不假”的论文,正在造成真实的伤害。

1.  临床干扰:当一篇基于FAERS的论文声称某款救命药(如GLP-1)与自杀倾向有关时,即便这只是统计噪声,也可能导致患者恐慌停药或医生保守处方,造成实质性的健康损失。
2.  资源浪费:为了验证这些虚假信号,宝贵的科研经费和临床资源被投入到不必要的后续试验中。
3.  文献污染:它们稀释了学术文献的信息密度,让真正有价值的信号淹没在噪音之中。

结语:一场关于评价体系的拷问

这600篇论文,像一面镜子,照出了当今学术评价体系的病态。在“发表或出局”(Publish or Perish)的压力下,一篇耗费数年心血的临床研究与一篇只需几天就能生成的FAERS灌水文,在某些量化指标上被赋予了同等的权重。

正如学者Spick所言,这是一个哲学问题:我们应该允许那些毫无意义的科学研究被发表吗?

当数据库成为牧场,当算法成为笔杆,学术界面临的不再是“造假”的敌人,而是“平庸”的汪洋。如果不改革唯论文数量的评价体系,今天堵住了FAERS,明天还会有无数个NHANES、TCGA被卷入同样的漩涡。

作者:杏鑫娱乐




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT 杏鑫娱乐 版权所有