为何现有的AI检测工具会“误判”?“如果把AI文本检测看作一场考试,那么现有检测方法就好比机械刷题、死记硬背答案的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道,“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但这在大模型迭代飞速的今天几乎不可能。”
让检测器学会“举一反三”,提升其泛化性能,是增强AI文本检测能力的关键。为此,研究团队另辟蹊径,提出DDL方法,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识。这种方法可精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。
在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的AI生成文本检测工具DetectGPT相比,使用DDL方法训练的检测器性能提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的AI生成文本检测方法Binoculars相比,性能提升68.03%。
48.19MB
查看779.70MB
查看42.3MB
查看351.51MB
查看
网友评论更多
973陆学安e
科创创新药ETF国泰(589720)涨1.92%,成交额6088.65万元
2025/08/26 推荐
4425顾绿朗522
创新药概念震荡反弹 昂利康等多股涨停
2025/08/25 推荐
985扶兴博qc
东方红医疗创新混合型证券投资基金(QDII)基金份额发售公告
2025/08/24 不推荐