打造中国最大的
AI信息汇总平台


AI检测人工智能课堂如何检查文章是否由AI编写(ChatGPT)

即使只是花了几分钟玩ChatGPT的人,多半会感到惊讶。但我们开始看到越来越多的AI写作内容——很难分辨到底哪些是人类所写。

AI检测人工智能课堂如何检查文章是否由AI编写(ChatGPT)插图
随着AI风靡全球,许多人开始质疑他们在线阅读的真实性。虽然AI写作检测工具并不是100%准确,但有一些综合方法可以帮助你解读所阅读内容的来源。

这有关紧要吗?如果你正在阅读这篇文章,我猜你绝对很关心。我也是。我每天都与作家合作。我无法容忍由AI生成的垃圾(或者当本来应该由人亲自撰写时,却用了AI生成的文字)。

优质内容不分来源。但除了实际写作质量之外,使用AI进行写作的伦理问题越来越普遍。

一些文章、论文和报告悄悄发表了机器产生的废话……这令人相当担忧。

我曾经和一些作家合作,明确告诉他们不要使用AI生成的论文,但他们还是尝试将其当作自己的作品。

我不会坐在这里说我讨厌ChatGPT,事实上,恰恰相反——我每天都在使用。但我认为应该由出版商决定他们的文字来源。

如果你没有被允许这样做,不要使用ChatGPT完成涉及敏感公司数据的商业报告,但可以放心使用它来加速你正在发明的新产品的描述。这正变成一个非常有趣的伦理问题。

随着GPT-4的发布,AI变得更加难以辨别。没有一种适用于预测AI的万能方法,特别是因为它并不是绝对的。你不能“检测”AI,只能预测它。

任何声称能做到相反的人都是在撒谎。情况变得如此糟糕,以至于连联邦贸易委员会都发表了一份正式声明。说到底,你只是在纸上看到了一些文字,对吧?

这并不总是直接的,也绝对不可证明。但有时候确定某物的来源确实是有帮助的。让我们讨论一些在尝试检查某物是否由AI编写或生成时要查找的技术和非技术因素。

如何判断一篇文章是否由AI编写
在Google的范围之外,学术界和其他专业人士看到了AI生成内容的大量涌现。因此,无论你是在学术、专业还是休闲环境中接触到内容,你可能希望找到一种验证某些内容是否由另一个人编写的方法。

检测AI生成的内容需要多个写作样本、各种工具和方法,仍然涉及一定程度的运气。不要依赖于单一的AI内容检测方法来断言某些内容是由AI编写的。这些只是上下文的猜测!

经过几个月的手动分析内容后,我发现自己仍然会因AI使用的复杂性而感到困惑。

虽然我曾以为大多数AI工具无法写出本科水平以上的内容,但在见识了GPT-4后,我的看法改变了。幸运的是,你可以使用一些工具和手动方法来帮助确定一段文字是否由AI辅助完成。

以下是我个人在2023年发现的用于发现AI内容的最佳技巧和工具:

方法一:使用不可检测AI的多检测工具
我们将首先介绍的工具是Undetectable AI,它可以帮助预测某物是否由AI编写。该工具通过检查内容使用经过调整的模型进行检查,该模型是根据每个AI检测器提交的批处理文档进行训练的(原创性、GPTZero等)。

在幕后,该工具根据训练情况分配一个可能性,以便根据所有经过测试的内容给出一个可预测的结果。

因此,当使用Undetectable时,该工具基本上会同时检查8种不同的检测器返回的AI写作可能性。

虽然这并不是最终结论,但它是一个非常有帮助的预测。这些工具中没有一个应该被视为绝对准确,决策也不应仅依赖于这些工具,但它们绝对有助于提供否则无法知道的上下文信息。

要使用Undetectable的AI检查器,请将你的写作样本粘贴到输入框中并提交进行测试!你将看到来自流行检测工具的结果,例如GPTZero、Writer、Crossplag、Copyleaks、Sapling、Content At Scale、Originality和ZeroGPT。

我提到过这个工具是免费的吗?!

Undetectable AI根据ChatGPT写作返回检测到的AI文本。所有检测器:GPTZero、OpenAI、Writer、Crossplag、Copyleaks、Sapling、ContentAtScale和ZeroGPT。

方法二:CopyLeaks AI检测器
最近出现的一个AI检测器是Copyleaks,它的准确性非常高。该检测器会警示你,如果它认为某段文字是由AI编写的或者是人工编写的,并没有其他太多的内容。你可以悬停在你认为可疑的文本部分(特别是高亮显示为红色的文本)上,然后查看百分比的分解。该工具支持GPT-4,并有两个检测模型,基础版和增强版。

他们还推出了一个免费的Chrome扩展程序,可以直接检查你的浏览器。该工具可用于检查个别实例的AI写作,但如果你想在短时间内扫描大量文档,则需要付费计划以使用API。

Copyleaks AI检测器输入框显示某些句子在段落中被标记为(或至少标记为)AI写作

如果切换到增强模型,你将被要求登录(或创建一个帐户)。在表面上看,这似乎并没有改变任何东西或描述任何AI如何编写。这可能只是一个吸引人注册的手段。我建议使用他们的基础测试器进行一般AI写作测试。

方法三:Originality.ai检测器 + 文本可视化工具(付费)
如果你想进一步测试你的文章是否被多个检测工具检测,你可以使用Originality AI来检查和可视化写作。Originality是我使用过的最严格的AI检测软件。

它真的致力于打击AI生成的写作,但相较于其他工具,它更容易过度诊断(误报)。如果你输入AI写作,它几乎肯定会标记为AI。

文本可视化功能是它与许多其他AI写作检测工具的不同之处。如果你有作家,请使用Originality检查他们的写作,然后使用他们的可视化器重新构建文章。

这只在你使用Google文档检查写作时才会起作用。但如果是这样的话,你可以使用他们的Chrome扩展来“重建”文章,看看它是如何写的。效果如下所示:

Originality.ai的文本可视化工具展示作家将写作复制粘贴到文档中

结合这个工具的复制/粘贴检测功能,你将对你怀疑的写作来源有很好的直觉。在上面的例子中,我实际上给了我雇佣的一个作家一个任务,他们使用AI生成了大约一半。在事物被复制粘贴之前,你可以清楚地看到这一点。

Originality使用了GPT-4和其他自然语言模型(所有模型都经过大量数据的训练)来确定内容是否看起来可预测。Originality似乎是唯一一个非常适用于ChatGPT和GPT 4(公开可用的最先进的生成语言工具)的AI内容检测工具。

从每100个单词开始的定价,如果你在寻找更专业、行业级别的内容检测检查器,这是相当合理的。我在使用它时运气不错,将继续在检查生产级别的文稿时使用它。

你可以像以前一样可视化写作,也可以简单地将你的文本粘贴到输入框中,就像其他所有工具一样。作为一个额外的功能,它还可以默认检测抄袭。

记住,5%的AI并不意味着样本中有5%是由AI编写的。这意味着如果你投掷100枚硬币来预测某物是否是由AI编写的,检测工具会在这100次中猜测有5次是由AI编写的。老师们一直误解了这些百分比的值,这导致学生陷入麻烦。这不好……

至于抄袭,它也非常令人印象深刻。Originality能够找到我“抄袭”内容的确切博客,并将文本标记为从网站(就是这个!)复制的内容。它能够如此迅速地找到这篇文章,让我印象深刻。就我个人而言,结合AI检测与抄袭检测是对写作内容来源更加确信的额外措施。

Originality对于任何希望自动化和轻松测试写作的人来说都是我的首选工具。与Undetectable.ai不同,Originality适用于更深入的内容检查。

它们还将你的扫描结果保存在你的帐户仪表板中,以便将来方便查看。

请记住,没有什么是真正确定的,我想要强调这一点。这些工具都是预测器。但为了增加预测的信心,你应该使用多个来源来测试、验证和可视化你怀疑的内容——而Originality目前是最擅长深入挖掘的工具。

可接受的检测分数
根据Originality的CEO所说,如果内容始终在10%以下,几乎可以确定没有问题!只有当内容接近40或50%的AI时,你才应该开始怀疑其来源。

你输入的样本越长,检测的准确性就越高(样本大小越大=可靠性更高)——但可靠性并不意味着准确性!此外,通过同一作者扫描更多的内容应该能够更好地帮助你判断他们的写作是否真实可信。

但要小心,有些结果可能是误报或漏报。与其根据单篇文章或文本片段做出判断,还不如审查一系列文章,然后判断一个作者或服务。

检查整个网站
如果有一系列持续高或低的检测分数,那就应该是你判断这些内容是否是由AI编写的最大指标。一篇单独的文章并不能证明整个网站(或多个内容文件)是否有AI的帮助编写。同时,重要的是要对这些检测工具持保留态度(我不能强调这一点的重要性!)。检查来自同一来源的更多文章会产生更大的统计样本,但是除了网站能做到的之外,还有许多因素影响检测。其中一些因素包括语法、重复和缺乏复杂性,我们下面会详细讨论。

Originality最近推出了一款一次性检查整个网站的工具。

方法四:使用GPTZero(非常小心和准确的检测)
我喜欢GPTZero,因为他们似乎是唯一一个关心他们标记的AI检测公司。虽然他们无法保证100%的准确性,但只有在他们对AI写作很有信心的情况下,他们才倾向于标记一些内容为AI。

他们更关注学术和教育写作,在我的非正式文章中我使用了这个工具,因为它可以进行最深入的分析。Undetectable对于简单地快速检查多个工具很好,Originality对于可视化很好,但GPTZero是我最喜欢的检测工具。

这个工具由一组才华横溢的机器学习和软件工程师组成,建立在7个技术”组件”上,很可能是目前公开可用的最准确和可靠的AI检测工具。去GPTZero免费试试吧,并尝试在各种不同类型的内容上使用(你也可以直接上传文件)。

如果你试图把上面的段落输入到GPTZero中,你会得到0%的AI几率(这是真的…我现在就坐在沙发上写这篇文章,我很确定我不是机器人)。它真的很厉害,能明确地知道有0%的机会是由AI写的。甚至一点点都没有。

方法五:Content at Scale AI检测器(轻松的休闲写作和免费的)
Content at Scale团队推出了一个免费的AI检测器,这是目前最好的工具,用于快速检测AI写作。这个工具基于数十亿页的数据进行了训练,可以一次测试多达25,000个字符(将近4000个单词!)。

要使用这个工具,只需将写作粘贴到检测字段中,然后提交它进行检测。在几秒钟内,你将看到一个人工内容分数(表示一段文字可能是由人类撰写的可能性),还会看到一行一行的分解,突出显示你的内容的哪些部分被标记为可疑或明显的AI。

AI预测的一个很大的部分是尝试重现模式。模式是很好的指标,因为AI生成器基本上就是通过训练来识别它们以产生最符合现有模式的内容。你的文字越符合现有的写作格式,它就越可能是生成的。

下面是两个ChatGPT输出与人类写作的对比截图。测试后,你也会看到预测性、概率性和模式分数。这些分数是对幕后情况的简化解释。人类产生的文字并不是非常可预测的,因为它不总是遵循模式。而AI写作正好相反,它只知道模式。

阅读这两个摘录,看看你能不能分辨出写作的不同。第一个似乎非常专业,但你几乎可以感受到下一个句子是关于什么的。人类的结果更加零散。它仍然是好的写作——只是更富有创造力。如果你想了解写作内容是由AI生成的,那就去Content at Scale吧,那里有一种高度准确的、一行一行的说明发生了怎样的情况。这里是两个截图,一个是混合了人类生成和AI内容的检测结果(50%可能),另一个是似乎完全由人类生成的内容检测结果(100%可能)。

方法六:Sapling的AI检测器
我从未使用过像Sapling AI这样的AI检测器。表面上看,它看起来简单,类似于GPTZero和Copyleaks。但是,不要被它的外表所欺骗。这绝对是我使用过的最严格的检测器之一,并且随着最新更新,它的性能只会变得更好。

这个工具与市场上的其他检测器一样工作。只需将你的文本粘贴进去,等待几秒钟,你将得到一个AI可能性百分比的输出,并且会对文本中可能是非人类生成的部分进行高亮标记。

它不仅可以精确检测到ChatGPT和Claude的内容,还可以精确定位那些使用Undetectable AI和HideMyAI等绕过工具转换的AI文本。

这个检测器是由斯坦福大学、UCB、Google和Meta的前开发人员构建的——在其AI检测的稳健性方面,这一点非常明显。

方法七:Writer.com的AI内容检测器
尽管检测AI内容的参数不清楚,但Writer.com提供了一个简单的、免费的AI写作检测工具。你可以通过URL或直接将文本粘贴到他们的工具中来运行扫描。我在使用它时效果很好,但很难找到它们确定标记内容的方法。

该检测器包括1500个字符的AI内容可免费检测,随时可以使用。它在检测ChatGPT生成的内容方面做得相当不错。

方法八:技术和句法迹象
要判断一篇文章是否由AI生成,另一种方法是查看写作的技术方面。这并不是很确凿,可能会显得显而易见,但如果你对之前的工具感到困惑,或者只是想更深入地分析你遇到的写作,你应该深入研究内容。以下是一些要注意的事项:

  1. 注意过渡词。ChatGPT喜欢使用过渡词。每隔几行它就会插入一个。例如“此外”、“另外”、“而且”、“因此”和“所以”经常出现,但在人类写作中并不总是出现。除非是更正式或专业的写作,否则我们并不会频繁“过渡”我们的写作。
  2. 大词汇词汇是可疑的。利用、实施、利用、阐明和确定等大词汇通常被过度使用,但在一般文章中,哪个人会像那样说话呢?几乎没有人。

人们在谈论时,更常见和更具可比性的是用过、解释和发现等更简单的词汇。

如果你使用了其中一种检测工具测试内容,并且内容是富有创造性和独特性的,我会说它是合乎规定的。那些在技术上表现自信但让人怀疑的内容,你需要进一步调查。

  1. 重复的词语和短语:另一种识别AI生成内容的方法是查看词语和短语的重复。这是AI试图用相关关键词填充空间的结果(也就是说,它并不真正知道自己在说什么)。

因此,如果你阅读一篇文章,感觉好像同一个词被反复使用,那么它更可能是由AI写成的。一些垃圾邮件式的AI生成SEO工具喜欢在文章中堆砌关键词。关键词堆砌是指你重复一个单词或短语,以至于听起来很不自然。

有些文章的目标关键词似乎几乎每隔句子出现一次。一旦你发现了它,你就无法专注于文章。对读者来说,这也是非常让人反感的。

  1. 缺乏分析:判断一篇文章是否由AI生成的第三种方法是它是否缺乏复杂的分析。这是因为机器擅长收集数据,但不擅长将其转化为有意义的东西。

如果你阅读一篇文章,感觉它只是一堆事实而没有深入分析,那么它很有可能是由AI写成的。对于ChatGPT来说,我们正接近AI能够开始分析写作的阶段,但我仍然觉得它的回答非常“机械”。

人们开始使用AI回复推文,但却没有意识到他们的回应是多么刻板!你会注意到,AI生成的写作对于静态写作(比如历史、事实等)要好得多,而对于富有创意或分析性的写作则要差得多。一个主题所包含的信息越多,AI就越能够更好地写作和处理它。

  1. 错误数据的幻觉:这种情况更常见于AI生成的产品描述,但在博客文章和文章中也能找到。这是一个巨大的指标!由于机器从各种来源收集数据,它们有时会犯错,或者简单地没有更新。

如果一个机器不知道某件事,但需要给出一个输出,它会根据模式(并不准确的模式)预测数字。这种情况经常发生,是(在我看来)判断AI的最简单的方法。

因此,如果你在阅读一篇文章时发现事实和数字之间有几处不一致,你可以非常有信心地说你刚刚读到的是用AI写的。如果你遇到了垃圾内容,请向谷歌举报。让别人不必浪费时间阅读明显不准确的东西!

方法九:验证你的来源和作者的可信度
这可能对于一个单独的博客来说似乎有些多余,但仍然值得一提。如果你正在阅读一篇文章,而域名似乎与发布的内容毫无关联,那么这是你的第一个警告信号。但更重要的是,你应该检查文章中使用的来源(如果有的话)。如果一个作者使用来自有问题的网站的来源,或者只是在没有任何来源的情况下声明某些事情,要么是作者没有进行研究,要么可能只是在自动化一堆AI生成的内容。

如果你想在谷歌上检查一篇文章,点击菜单,查看谷歌对该网站的所有信息。以下是我们的情况:

查看谷歌在Gold Penguin网站上的历史记录

你可以看到我们大约在2年前被谷歌索引,但谷歷新闻不是很了解我们。将这些信息与你自己的判断相结合,判断某件事是否值得信任。

谷歌显示它第一次对Gold Penguin网站进行索引的时间以及它无法找到该网站的太多信息

OpenAI停止了他们的官方AI检测器
这个疯狂背后的公司OpenAI,几个月前发布了一个工具来帮助检测写作。使用官方工具,OpenAI最初声称他们测试的AI写作样本中只有26%被正确识别为AI。

在网络营销和写作社区对该工具的准确性产生怀疑后,似乎他们是正确的,因为OpenAI于2023年7月20日停止并从他们的网站上移除了他们自己的AI检测工具:

截至2023年7月20日,由于其低的准确率,AI分类器不再可用。我们正在努力吸收反馈,并正在研究更有效的文本来源技术,并承诺开发和部署机制,使用户能够了解音频或视觉内容是否由AI生成。

https://openai.com/blog/new-ai-classifier-for-indicating-ai-written-text我对这个检测工具的初步看法是它看起来像是抛硬币。我测试了很多来自ChatGPT的输出,结果是“无法确定”和“不太可能由AI写成”。我从未使用过这个工具。

我建议使用类似于Originality和Content at Scale这样的工具,可以提供一些不错的见解。请记住,没有什么是100%确定的,这也是OpenAI从他们自己的网站上移除该工具的原因之一。

巨型语言模型测试室不再工作
来自MIT-IBM沃森人工智能实验室和哈佛自然语言处理组的三位研究人员创建了一个名为Giant Language Model Test Room(或简称GLTR)的优秀免费工具,来帮助检测机器生成的文本内容。GLTR是一种最直观的方式来预测是否是由AI生成的文本。

每个单词都根据左边的上下文预测的单词,来分析其可能性。如果这个词在前10个预测单词内,背景就会被着色为绿色;如果在前100个预测单词内,背景将被着色为黄色;如果在前1000个预测单词之外,则是紫色。如果你看到内容中有很多绿色,那很可能是由AI生成的。

这是AI模型之间差异的一个很好的指标。虽然它不能完全确定,但却是一个相当不错的指示。它不再可用,但是对目前检测这篇文章对每个词进行分析,根据左侧的上下文,分析每个词成为预测词的可能性。如果该词在前十个预测词内,则背景颜色为绿色;如果在前100个内,则为黄色;在前1000个内,则为红色;否则为紫色。如果你看到大量绿色内容,很可能是由人工智能生成的。

以下是人工智能生成的文章节选与人类撰写的文章的对照。你可以看到人工智能生成的文本比人类撰写的文本多得多地突出为绿色。

人工智能生成的文章文本,明显以绿色为主要突出显示
纽约时报的文章,通过不同的高亮颜色显示,不太可能是由人工智能撰写的
虽然不是绝对可靠,但是是一个相当不错的指标。这个方法已经不再适用,但对于了解当前检测器的工作方式还是很有见地的。

金企鹅的AI检测工具
几周前,我和一个开发团队一起创建了我们自己的AI检测工具。我厌倦了使用那些过度检测大量文本的工具。如果辨别某物是否由AI编写如此困难——我宁愿不管它。我不希望任何未经检测的东西被检测出来,即使这意味着我会让一些真正的AI通过。但这没关系,这项技术毕竟不能准确地检测一切。

这个工具是免费的,和其他工具一样,只能作为参考。它非常适用于让你知道某些内容明显是由AI生成的,但对于更复杂的工具,你可能应该使用另一个工具。

金企鹅自己的AI写作检测工具,不会过度检测非AI生成的内容
其他在线检测方法
当你找到声称可以检测内容是否由AI生成的随机网站时要小心。如果你正在寻找AI内容检测工具,请确保它们描述了他们检测内容的方式——因为”ai检测”本身并没有任何意义!

最后的想法和接下来的发展方向?
要确定一篇文章是否由AI撰写并不是最容易的事情,因为你事实上无法确定。更糟糕的是,人工智能每天都在变得更加优秀。几个月后GPT-5会是什么样子?我甚至无法想象。

也就是说,如果你怀疑一篇文章是否由AI撰写,最好的方法是结合所有这些工具以及你自己的判断力。对同一作者的多篇文章进行测试以提高可靠性。

请记住要对所见到的结果持保留态度。你所看到的东西在任何方面都不是确定的,因为没有一种确切的方式来检测AI。记住你所处理的东西没有水印,你只是在屏幕上看到文字而已。

希望这些新工具能让怀疑论者通过互联网、新闻以及世界各地的学校系统过滤出由AI生成的内容。

随着人工智能变得越来越复杂,人类和机器生成的内容之间的界限变得越来越模糊,AI生成的内容变得难以区分只是时间问题!

让我们拭目以待未来几个月会给我们带来什么。

赞(0) 打赏
未经允许不得转载:AI爱好者 » AI检测人工智能课堂如何检查文章是否由AI编写(ChatGPT)

评论 抢沙发

欢迎来到AI爱好者

我们旨在打造一个最具实力的中文AI交流社区平台,致力于为所有AI爱好者,创业者和使用者提供优质服务. 我们的宗旨是为广大用户提供免费解决方案,您可以通过问答形式提出与AI相关的任何问题.

AI社区AI工具

安全服务战略合作伙伴:麒麟盾 SCDN

觉得文章有用就打赏一下文章作者

非常感谢你的打赏,我们将继续提供更多优质内容,让我们一起创建更加美好的网络世界!

微信扫一扫打赏

登录

找回密码

注册