Nature重磅起底「论文工厂」,1300多篇嫌疑文章大批量造假!机器学习实验室共 3549字,需浏览 8分钟 ·2021-03-30 16:24 转自:新智元编辑:小匀【新智元导读】近日,Nature重磅发布了一篇名为「打击科学造假的 “论文造纸厂”」的长文。文章指出,一些大规模学术造假行为正嚣张;而另一边,一群「侦探」们也自发打假,想出应对策略。明明不是同一位作者,为什么这些论文的图标和标题却是如此的相似?学术杂志RSC Advances的执行编辑费舍尔注意到了这一点,并决心调查这一切。一年后,即2021年1月,费舍尔从该杂志上撤回了68篇论文,与此同时,英国皇家化学会(RSC)其他两个刊物的编辑也因类似的怀疑而各撤回一篇论文。不仅如此,还有15篇论文仍在调查中。这些被撤回的论文就像是流水线生产出来的,更奇怪的是,它们竟如出一辙地来自中国医院的作者。期刊的出版商,伦敦RSC在一份声明中宣布,它已成为「系统性生产伪造研究」的受害者。3月23日,Nature发布了一篇标题为「The fight against fake-paper factories that churn out sham science」的文章,讲述了由论文撤稿引发的「造纸厂」反侦察。「造纸」侦探学术期刊届早就对「造纸厂」有些防备。根据《自然》杂志的一项分析发现,自去年一月以来,期刊至少撤回了与造纸厂公开关联的370篇论文,并且预计还会有更多的撤稿。这种文献清理工作的产生,很大程度上是因为去年,外部侦探公开标记了他们认为来自造纸厂的论文,因为这些论文的特征可疑地相似。分析显示,这些被标记的论文名单总共有1000多项研究。编辑们对这个问题非常关注,去年9月,伦敦的一个出版商咨询机构--出版伦理委员会(COPE)举办了一个论坛,专门讨论「通过造纸厂系统性地操纵出版过程」的问题。主讲嘉宾是Elisabeth Bik,她是加利福尼亚的一位分析家,以善于发现论文中的重复图像而闻名,也是在网上发布对造纸厂的关注的侦探之一。除此之外,在2020年1月,Bik和其他以化名侦探--Smut Clyde、Morty和TigerBB8,他们在科学记者Leonid Schneider经营的博客上发布了一份400多篇发表论文的清单,他们说,可能来自一家造纸厂。Bik将其称为「蝌蚪 」造纸厂,这是一种称作western blot(蛋白质转渍法分析)中出现的形状。左图和右图来自不同的手稿,作者和所属机构不同另外,知名打假人Hoya Camphorifolia也制作了下图:可以看出,「蝌蚪 」造纸厂的western blot图的背景图案相同除了所有400多篇论文中Western blot的相似性之外,还有些论文中的柱状图大多看起来也非常相似。它们通常采用纯灰色的色调,黑色的条形图在左边,并且有双边的误差条。来自四个不同研究小组的论文这种布局相似的数字不一定是问题,可能是例如流行的图形程序的标准格式。但是,如果在不同机构的100多篇论文中发现同样的布局,这就是一个危险的信号。随后,一连串的媒体头条新闻接踵而至。在这一年里,侦探们发布了其他可疑的论文清单,它们在多项研究中发现了类似的特征。到2021年3月,根据《自然》杂志的统计,他们总共列出了1300多篇可能来自造纸厂的文章。完整版:https://media.nature.com/original/magazine-assets/d41586-021-00733-5/18994812到目前为止,被怀疑来自造纸厂的文章中,约有26%被撤回或贴上关注的标签。许多其他仍在调查中。例如,《细胞生物化学杂志》(JCB)在2月1日宣布,去年,编辑们调查并撤回了涉嫌包含图像处理的137篇论文中的23篇。但则并不意味着所有的「嫌疑犯」都有问题。出版JCB的Wiley公司研究诚信总监Chris Graf在1月份表示,该出版社已经完成了对Bik等人发现的73篇论文的调查,并没有发现对其中11篇论文采取行动的理由;另有7篇需要更正,55篇已被撤回或将被撤回。然而,令我们感到不安的是,大多数问题论文,来自中国,特别是医院机构。中国医疗作者占据「半壁江山」《自然》杂志发现,自去年年初以来,中国医院又有197篇作者的论文被撤稿。尽管有些产品经常被发布后的同行评审网站PubPeer所标榜,但仍未将它们列入潜在的印刷厂产品列表中。中国长期以来一直存在着向研究人员出售论文的公司问题。早在2010年,时任中国武汉大学管理学研究员的一个团队就警告说,有网站提供代写虚构研究的论文,或者绕过同行评议系统进行付费。2013年,《科学》报道了中国研究论文的作者资格市场。2017年,中国科技部(MOST)表示将打击不端行为,此前,《肿瘤生物学》杂志发生了107篇论文被撤稿的丑闻;这些论文的同行评议是捏造的,科技部的调查认为,有些论文是由第三方公司制作的。中国的医生是一个特殊的目标市场,因为他们通常需要发表研究文章才能获得晋升,但医院工作太忙,他们可能没有时间做科研。去年8月,北京市卫生主管部门发布政策规定,主治医师想要晋升为副主任医师,必须至少有两篇第一作者的论文在专业期刊上发表;要成为主任医师,必须有三篇第一作者的论文。一位现居美国的中国某医院前高级医师、胃肠病学研究员说,这些头衔会影响到医生的工资和权力,也会影响到他们被允许做的手术。国内「论文造假」事件层出不穷爱思唯尔在今年给《自然》杂志的一份声明中表示,其期刊编辑每年都会检测并防止发表数千篇可能是纸厂投稿的论文,尽管有些论文确实能通过。近年来,国内也「论文造假」等事件也层出不穷。202年7月,加州大学圣地亚哥分校付向东教授实名举报中科院上海神经所杨辉抄袭,但随后杨辉团队做出书面回应否认抄袭。杨辉团队声称自己的想法来源2020年9月,科技部网站发布通报,披露9起涉及购买论文、违反论文署名规范、套取财政科研资金的违规案件处理结果。从通报内容可以看出,9起案件中有7起涉及论文买卖,而论文造假中研究生占据多数。1月26日,《自然》发表了一篇题为《中国著名免疫学家曹雪涛没有剽窃和造假》的新闻。这就是年初震惊学界的「图片误用」事件。自2019年11月14日,斯坦福大学博士Elisabeth Bik在PubPeer指出曹雪涛存在学术不端,有多达40篇署名曹雪涛的论文被质疑实验图片造假。随后,中国工程院表示对此问题展开调查。2021年1月21日科技部发出《有关论文涉嫌造假调查处理情况的通报》,对网络质疑曹雪涛院士的63篇论文,经调查「未发现」有造假、剽窃和抄袭,但发现较多论文存在「图片误用」,反映「实验室管理不严谨」。大量的类似事件引起了极大关注。中国科学和教育部已采取措施,遏制有问题的出版激励措施。去年2月,中国发布了一份通知,告知包括医院在内的研究机构不要仅仅根据发表的论文数量来促进或招募研究人员,还告诉他们停止为论文支付现金奖励。8月,中国宣布采取措施打击研究不端行为,包括试图遏制以他人名义制造数据的独立承包商。一些中国研究人员认为这些措施已经开始起作用。中国上海复旦大学研究科学政策的李唐希望,未来中国造纸厂的投稿将有所减少。当然,这一问题并不局限在中国,在伊朗和俄罗斯「造纸厂」活动也十分猖獗。《欧洲药理学杂志》(European Journal of Pharmacology)主编Frank Redegeld说,他还没有看到疑似造纸厂稿件数量的减少,目前这个数字是每月15篇。参考资料:https://www.nature.com/articles/d41586-021-00733-5https://scienceintegritydigest.com/2020/02/21/the-tadpole-paper-mill/https://www.nature.com/articles/d41586-021-00733-5原文链接:https://mp.weixin.qq.com/s/ffUu_pVirrSfcQzfNwKAYw往期精彩:【原创首发】机器学习公式推导与代码实现30讲.pdf【原创首发】深度学习语义分割理论与实战指南.pdf 谈中小企业算法岗面试 算法工程师研发技能表 真正想做算法的,不要害怕内卷 算法工程师的日常,一定不能脱离产业实践 技术学习不能眼高手低 技术人要学会自我营销 做人不能过拟合点个在看 浏览 28点赞 评论 收藏 分享 手机扫一扫分享分享 举报 评论图片表情视频评价全部评论推荐 Nature重磅起底「论文工厂」,1300多篇嫌疑文章大批量造假!新智元0Nature重磅:起底“论文工厂”,与学术欺诈作斗争大数据文摘0离谱!诺奖得主被曝40多篇论文造假!肉眼品世界0离谱!诺奖得主被曝40多篇论文造假!数学算法俱乐部0诺奖得主被曝40多篇论文造假!离谱!C语言题库0起底组 起底組起底组 起底組0嫌疑社會派推理宗師松本清張經典短篇 四度影視化之傳奇作品! 「與其追求文章的華麗,毋寧寫出真實的文文章篇九文章篇九 夫文章者,原出五经,诏命筞檄,生于书者也。序述论议,生于易者也;歌咏赋颂,生于诗者也;祭祀嫌疑嫌疑0文章篇九文章篇九 夫文章者,原出五經,詔命筞檄,生於書者也。序述論議,生於易者也;歌詠賦頌,生於詩者也;祭祀点赞 评论 收藏 分享 手机扫一扫分享分享 举报