毕业季的到来,高校正面临一个棘手的问题:学生论文中“AI 味”过浓。除了传统的查重、盲审和答辩,一种名为 AIGC 检测的新环节——人工智能生成内容检测,已成为毕业生们在论文提交前需要跨越的另一道门槛。

有毕业生发现,其论文的 AI 生成内容比例高达 62%,远超学校设定的 15% 的警戒线。在尝试使用大模型输入“帮我把这篇论文改得像人写的”指令进行修改后,再次检测,AI 率竟飙升至 94%。这种情况并非个例,近期不少毕业生都反映遇到了类似问题。

央视新闻近期深入介绍了检测论文“AI 率”的原理。首都师范大学教育学院副院长蔡海龙解释称,传统的查重是通过将论文语句与语料库进行比对,以识别重复性并做出确定性判断。而 AI 检测则是利用 AI 系统来分析人类文本,判断其在语意和表达风格上是否与 AI 写作存在重叠,其本质上是一种基于概率的分类,而非基于证据的确定性判断。

当前 AI 检测技术面临的核心挑战在于“用 AI 去查 AI”。这种方式使得准确判定一段文字究竟是人类作者所写还是 AI 生成变得困难,也无法对此提供明确的解释,这构成了技术瓶颈的关键所在。

此外,中文语言表达的丰富性和多样性也为 AI 检测带来了难度。中文语意极其丰富,语句表达方式也多种多样,这导致人工智能系统在检测人类作者所写的语句时,容易产生歧义,增加检测难度和降低准确率,进而可能导致误判。

鉴于目前 AI 率检测的精准度尚未达到理想水平,有专家建议,在论文审核过程中,应建立透明且可追溯的 AI 使用标注制度,而不是简单地设定 AI 率的“红线”。在判定机制上,应确立以人工评议为主、AI 检测为辅的“人机共判”模式。

尽管当前学校为学生论文设置了“AI 率”检测的红线,但不少学生反映,学校的论文 AI 率检查主要依赖于指定的检测平台和算法模型的分析。

目前,大多数主流高校普遍采用知网、维普、万方等系统的 AIGC 检测模块。据央视记者了解,这些系统判断文章 AI 生成内容的比例,主要通过分析“困惑度与突发性”等特征。通常而言,AI 生成的文本显得更为“平滑”,而人类创作的文本则具有更大的波动性。

大模型普遍认为,困惑度指的是文本的“可预测性”,越是充满人类特有的、意想不到的、跳出常规的表达,越倾向于被认为是人类所写。突发性则关乎文本节奏的波动,人类写作的节奏变化如同心电图般起伏,而 AI 的输出则相对平稳,如同直线。那么,这样的判断是否准确呢?

专家对此表示,除了困惑度和突发性等指标外,AI 文本生成的原理是通过预测下一个最有可能出现的词语的概率来逐步生成文本,这本质上是一种概率统计。因此,目前检测 AI 生成内容的准确性无法达到 100%,误判的情况时有发生,这也使得在学术诚信方面,尤其是在即将到来的世界杯2026赛事期间,对学术成果的严谨性要求更加凸显。