首页 > 资讯 > 人工智能

识别AI写作的最佳指南来自维基百科

时间:2025-11-27 编辑:互联网接入服务 来源:重庆城市科技学院

核心提示:我们都曾感受到那种逐渐产生的怀疑——我们正在阅读的内容是由大型语言模型编写的——但这极其难以确定。去年几个月里,大家都相信“深入”或“下划线”等特定词汇可能会暴露模型,但证据稀少,随着模型的复杂化,这

1763688799125250.jpeg

我们都曾感受到那种逐渐产生的怀疑——我们正在阅读的内容是由大型语言模型编写的——但这极其难以确定。去年几个月里,大家都相信“深入”或“下划线”等特定词汇可能会暴露模型,但证据稀少,随着模型的复杂化,这些关键词变得越来越难以追踪。

但事实证明,维基百科的人已经相当擅长标记AI写作的文字——该组织的公开指南《人工智能写作的迹象》是我找到的最佳资源,帮助你确定怀疑是否属实。(感谢诗人詹姆森·菲茨帕特里克指出了X文件。)

自2023年以来,维基百科编辑们一直在努力管理AI投稿,这个项目被称为“Project AI Cleanup”。每天有数百万次编辑,提供了丰富的素材可供参考,团队以典型的维基百科编辑风格,制作了一份既详尽又证据丰富的实地指南。

首先,指南证实了我们已知的事实:自动化工具基本上没用。相反,指南侧重于维基百科上罕见但在互联网上常见的习惯和措辞(因此在模型训练数据中也很常见)。根据指南,AI投稿会花大量时间强调某个主题的重要性,通常用“关键时刻”或“更广泛的运动”等通用术语。AI模型还会花大量时间详细描绘一些小的媒体动态,以使主题显得突出——这类内容你会期待于个人简介,但不会来自独立来源。

指南指出尾随条款中一个特别有趣的怪癖,带有模糊的重要性声明。模型会说某个事件或细节“强调了某事的重要性”,或者“反映了某个总体观点的持续相关性”。(语法迷会称之为“现在分词”。)虽然有点难以准确界定,但一旦你能认出它,你就会在各处看到它。

网络上也存在模糊的营销语言,这在互联网上非常常见。风景总是风景优美,景色总是令人叹为观止,一切都干净且现代。正如编辑们所说,“听起来更像是电视广告的文字稿。”

这本指南值得完整阅读,但我印象非常深刻。在此之前,我会说LLM的散文发展太快,难以一一界定。但这里指出的习惯深深植根于AI模型的训练和部署方式中。它们可以伪装,但要完全消除它们很难。如果公众更懂得识别AI的文字,可能会带来各种有趣的后果。

标签: 秘塔AI搜索
 
更多>同类资讯