如何选择SCI论文查重软件及如何降重?

目前国际SCI期刊越发重视英文论文的重复问题,导致由于重复率过高而被拒稿的悲剧不断发生(如图1),Papergoing团队不断有老师或博士生咨询被拒后怎么办的问题?因此非常有必要谈谈如何降低重复率。

图1 重复率过高—中国学者投稿SCI期刊《Engineering Structures》后被拒稿

为了让大家更好地学习和掌握查重和降重方法,Papergoing科学团队负责人Dr. Wu在知乎live中进行了系统的讲解,其主要内容是:

♦查重的必要性

♦重复的原因

♦权威查重算法的原理(图2展示其中一张PPT

♦降重的方法及案例分析

♦Q&A

图2 英文论文查重算法原理的理论认知

谈及为何要从论文查重读必要性入手时,Dr. Wu表示很多人还没有意识到一旦被SCI期刊查出高重复率后就会被直接拒稿的严重后果。毕竟很多同学还是首次或第二次投稿SCI论文,还没意识到被查重的严重性。但是一旦被SCI期刊抽查到,那就是无情的拒稿或大改,而且在日益注重学术声誉的今天,重复率过高带来的后果,往往是研究者难以承担的。同时,在知乎live课程中,Dr. Wu非常注重论文查重原理和机理的分析,因为这是有效避免论文重复的前提,只有把握查重背后的原理,才能做到在平时撰写英文论文时避免重复,在重复率过高需要改写时游刃有余。

但还是不断有同学们来咨询,具体的查重到底是怎么回事,用什么软件等这些实用问题。于是,我们结合Papergoing的查重服务,进行如下的客观分析:

权威查重软件

有很多的软件可以用来论文查重,但秉持着严谨的原则,Papergoing团队用科学研究的一贯方法,从一堆软件中对查重软件进行了深入的分析和调查(如Plagiarism Checker, PaperPass, iThenticate,turnitin),并为大家推荐国际上最为权威的查重软件。

在英文论文查重的软件中,国际上目前有以下两个最权威的查重系统:

iThenticate,也叫Crosscheck,俗称查重专业版。目前为止,其权威性在所有查重软件中是最高的,包含的数据库非常全面且更新及时,包括绝大部分数据库(爱思唯尔、斯普林格出版社等)的期刊论文,会议论文,博士论文,网页数据等,都是千万级乃至亿级的论文数据(如图3所示)。因此,想逃脱它的火眼金睛,除非有高超的改写技巧,否则几乎不可能。同时,它也是目前最受国际SCI期刊认可的查重软件。在Papergoing分析过的SCI论文审稿意见中,如果涉及到被查重,使用的软件都是iThenticate。它也是Dr. Wu在知乎live演讲案例中使用的查重软件。

图3 查重软件iThenticate包含的数据库

第二个查重软件是跟iThenticate同属于一家公司的Turnitin。我们用两个系统对同一篇论文进行查重后并对比结果发现,二者的主要差别是数据库的范围。Turnitin由于主要用于国外大学在校生的作业和毕业论文检查,因此没有包含英文博士论文数据库ProQuest,而iThenticate则包括ProQuest。图4是利用iThenticate查重的某篇英文论文的查重结果,该结果显示论文中有38个单词与西澳大学的博士论文(7)重复。

图4 查重软件iThenticate包含博士论文数据库ProQuest

因此,为了确保查重率的准确性,我们建议大家使用包含数据库更为完整的iThenticate。但iThenticate查重费用较高,官方网站价格100美元。只有像Papergoing一样有大量的合作,才能享受惠民价格(128元人民币),可点击Papergoing网站了解查重服务。

5 Papergoing提供专业级别的英文论文查重

如何才能有效降低重复率?或如何改写?

可参考Dr. Wu知乎提到的降重方法:

总原则:保持句子意思不变或相近。Dr. Wu 总结的关于英文论文降重的三步走路线是:

♦理解句子意思并确保改写后意思相近或不变

♦整体改变句子结构,方法有 a) 复杂句与简单句转换;b) 主动句与被动句变换等

♦局部改动关键词,方法有a) 词组变换;b) 同义词变换;c) 单词形式变化(单复数变化等)

案例分析:

原文句子:However, little research has been carried out on the material properties of lean duplex stainless steel at elevated temperatures.

有效改写的句子:While the material property of lean duplex stainless steel during high temperature exposure has received little focused attention so far.

该案例中用到的主要技巧有:

♦变换句子结构:被动(has been carried out)变主动(has received):

♦同义词替换:however-while, elevated-high

♦单复数变化:properties-property

♦词组变换:at elevated temperatures- during high temperature exposure

此外,虽然目前图片重复不能被查重软件自动识别出来,但是一旦被人举报,SCI期刊编辑将有义务对图片进行查重,并且一经发现,后果很可能是被撤稿。案例请见往期文章

总之改写的最高境界是保持意思不变,灵活运用不同句子结构和单词形式。如果只是简单的分割段落、句子,插入空格,拼接句子,打乱句子顺序,在目前强大的查重算法面前,降重效果将会很苍白!

论文查重常见问题

1.需要带参考文献进行全文检测查重吗?

不需要,因为参考文献肯定会有重复,SCI期刊编辑当然会意识到这个问题。因此他们在查重时,会在查重软件中关闭检查参考文献的选项。不过,在实际工作中,Papergoing查重老师发现有些期刊编辑连同参考文献进行了查重(如图6所示),有可能是忘记在软件中关闭参考文献选项。不过没有关系,大家可以联系期刊编辑进行更正说明。

6 参考文献也进行查重的结果

2.如果在完全引用时,比如引用某个概念的定义,在两端加上双引号“”。这样也会认定为重复吗?

是的,即便有双引号,也会被认定为完全重复,因此建议大家尽量不要照搬定义。如果非得写定义,可转述或直接引用参考文献,比如The definition of xx can be found in xx Ref.

7 方框中的淡蓝色部分是引用的定义,但是被认定为重复!

3.是不是引用很旧的文献,就有可能逃开查重?

有可能,只要不在查重软件的数据库中,就可以避开,不过目前的数据库已经非常全了,非常难以脱离检测范围。

4.查重后,我的论文会被录入查重的数据库吗?我担心期刊再次查重时,会造成重复。

不会,经过专业的iThenticate查重,不会将论文录入数据库,因此不需要担心录入引起的查重。但请注意有些查重软件可能会录入数据库,因此,需要在查重前,谨慎选择查重工具。

5. 重复率一般得控制在多少?

总重复率在10%以下且单篇不超过5%会比较安全,基本不会算做重复;但如果总重复率超过20%,这样的论文基本会判定为重复严重而拒稿。著名学术出版社Springer也表示如果重复率超过20%,这篇论文会被仔细的检查内容以确认是否确实重复太多。

举例1:SCI期刊-KSCE Journal of Civil Engineering对所有提交论文采用iThenticate进行查重,重复率高于20%直接拒稿,但给降重后再投稿的机会。

举例2:SCI开放性期刊-PLOS ONE对所有论文进行查重,根据Papergoing团队得到的作者反馈,虽然期刊没有指明具体的重复率会拒稿,但是会在初审意见中向作者给出重复率较多的期刊。

6.为什么连简单词汇,例如of, a等都会被查出重复?

答:这需要理解查重原理。如果两个句子主干结构一致,那么其中的关键词如果是一样,就被认为是重复。比如:

原文句子:However, little research has been carried out on the material properties of lean duplex stainless steel at elevated temperatures.

重复句子:While most of the previous research has been focused on the material behaviour of carbon steel and stainless steel at elevated temperatures.

下划线部分的单词都被算作重复,重复率高达 12/22=55%。如果我们分析这两句的句子结构,我们发现两个句子结构是一样的:research has been xx on the material xx of xx at xx. 这就是导致重复的根本原因。句子结构一致基础上,如果关键词一样,比如句子中的of,也会被认定为重复。

作者:Papergoing科学团队

发表评论

电子邮件地址不会被公开。