我们在上篇文章中介绍了同方知网CNKI查重系统,也叫学术不端文献检测系统的检测指标。其报告的检测指标分为总检测指标和子检测指标(见知网查重总检测指标和知网论文检测子检测指标)。下面我们来介绍子检测指标中最重要的一个指标:文字复制比(TR)。
因为学位论文一般文字量较多,为了便于用户快速浏览检测结果。知网论文查重系统会自动对学位论文进行切分处理。有如下两种处理方式:
1.若用户提交的论文是MS Word格式,且按照MS Word格式生成了文档目录,知网论文检测系统会自动识别论文章节,按论文实际章节信息显示论文内容。
2.若学位论文不存在明显的章节信息,或者不是MS Word格式论文,则知网检测系统会自动按照每段1万余字符切分学位论文,按照切分后的结果显示。
文字复制比即指论文切分后每一章节段落的文字复制情况。文字复制比即指学位论文的某一章节与比对文献比较后,重合文字部分在该章节中所占的比例。比例越高,反映该章节越多的文字来自于其他已发表文献。文字复制比反映了文章“抄袭”的文字数量比例,一般来说,文字复制比越高,存在学术不端行为的可能性越大。文字复制比情况如下图所示:
知网查重子检测指标另外一个比较重要的指标是:重合字数(CNW)。
重合字数指学位论文该章节与比对文献比较后,重合部分的字数。一般来说,不管文字复制比如何,重合字数越多,存在学术不端行为的可能性越大。如下图所示,在图中,虽然文字复制比只有16%,比例不高,但图中左文标红部分实际上是抄袭了右文的标红部分。