
据日本《朝日新闻》报道,美国堪萨斯大学的研究团队近期发现了一种新的检验办法,可以精准判断一篇论文是否由 ChatGPT 创作,其精准率可达到 99%。
订阅T客邦电子日报,升级科技原力!立即订阅
目前,用户只需要输入一组资料,并附言「请使用这些资料写一份学术论文」,ChatGPT 就能在几十秒内创作一篇可以假乱真的论文,这使得许多论文作者已经部分甚至全部使用 ChatGPT 来写论文。
不过,一些学术期刊和研究机构已经警告,如果这些作者在提交时没有明确说明自己使用了 ChatGPT,则构成抄袭或其他欺诈行为。
出于这个原因,检测文章是否是由 AI 生成的相关工具研发已经取得了进展,但到目前为止,还没有专门用于学术论文的检测工具。

堪萨斯大学的研究团队则专注于从“段落复杂性”和“常用短语”着手,训练一个新的 AI 来检验一篇论文是否由 ChatGPT 生成。
报道称,研究团队在截至2023年3月的半年内,从美国学术期刊《科学》杂志上选取了64篇论文,并让ChatGPT为论文生成300-400个字左右的摘要,最终生成了128篇由ChatGPT创作的文章,并被用于训练这个新的检测AI模型。
经过训练,该模型可以从 AI 生成的文章中 100% 识别出人工创作的部分,对文字中特定段落的识别精准率为 92%,综合精准率达 99%。 相关成果已经发布在了《Cell Reports Physical Science》杂志上。

另一方面,人类更习惯将长句和短句交错使用,并且在句式上也与 ChatGPT 的惯用写法有所差异。
根据论文中,他们用来判断是否是GPT产生论文的分辨方式,有四种面向,又可以分成主要两种差异类别:
ChatGPT 会产生比人类科学家更简单的内容的方式
模型中使用的四类功能中有两类是ChatGPT生成比人类更简单的内容的方式。 最大的区别特征是每段的句子数和每段的总单词数。 在这两种情况下,ChatGPT的平均值都明显低于人类。 我们还发现,人类比ChatGPT更喜欢改变他们的句子结构:虽然平均句子长度不是两组的有用鉴别方式,但在任何给定段落中,句子长度的标准差是一个有价值的识别辅助方式,正如给定句子和紧随其后的句子之间的中位数差异(以单词表示)。 人类比 ChatGPT 更能改变他们的句子长度。
ChatGPT 写作风格与人类科学家不同的方式
其余两类差异化特征可以更多地描述为「风格」的选择。 一方面,人类会更频繁地使用问号、破折号、括号、分号和冒号,而 ChatGPT 使用更多的单引号。 科学家们还使用更多的专有名词和/或首字母缩略词,这两者多半都以大写字母来出现。 另外,科学家们会使用更多的数字,而ChatGPT 似乎更喜欢提供笼统的信息,而这个压倒一切的主题表现在特定词频的差异上。
ChatGPT 通常写到人的时候,会写一些比较模糊的、概括的写法,包括「其他人」和「研究者」,而人类比较会指名道姓,说出他们正在描述其工作的科学家的名字。 人类科学家还在训练数据中展示了其他一致的模式:他们更有可能使用模棱两可的语言(然而,但是,尽管),并且他们也更频繁地使用“this”和“because”。
研究团队发现,ChatGPT 很少使用“虽然…… 但是…… (but、however、although)“这类表述。 相反,它很喜欢使用“他人(others)、研究者(researchers)”等词语。
欢迎免费使用GPT对话,感受ChatGPT的魅力!AI爱好者 – 最具实力的中文AI交流社区平台 (aiahz.com)
长按扫描二维码进群领资源
