随着以ChatGPT为代表的新一代人工智能技术的迅猛发展,其在学生教育和出版模式上的颠覆性影响日益显现。最近,同方知网数字出版技术股份有限公司申请的“一种AI生成文本的检测方法、装置、介质及设备”专利引起广泛关注,为应对AI代写现象提出了创新性的解决方案。
专利创新:自动检测AI生成文本
最新专利显示,该发明可以判定待检测文本是否为AI生成文本,实现自动检测,提高了检测效率并减少了主观因素的干扰,从而使得检测结果更加准确。
检测方法概述
专利文件揭示了该方法的基本步骤:
通过获取待检测文本、文本分类模型、目标损失函数、预设字典及预测模型;
将待检测文本输入文本分类模型,得到待检测文本为AI生成文本的第一概率值;
基于待检测文本及目标损失函数,得到待检测文本的偏离度特征;
基于待检测文本、预测模型及预设字典,得到待检测文本的扩散度特征值;
基于待检测文本,得到待检测文本的句子长度特征及字词分布特征;
根据第一概率值、偏离度特征、扩散度特征值、句子长度特征及字词分布特征判定文本是否为AI生成文本。
AIGC检测服务系统
同方知网于今年9月推出"AIGC检测服务系统",该系统通过半年的探索和技术攻关,解决了内容识别、算法效率、可信评估等技术难题。该系统的亮点包括:
支持检测国内外各类大模型生成的中文文本;
通过大量数据测试,系统有效识别出不同程度疑似AI生成的文本内容;
支持上传单/多篇各类格式文档、压缩文件或手工录入等多种方式;
实时追踪检测进度、查看检测结果,并提供可视化报告单,呈现AI生成文本详情。
AIGC技术的应用场景
该检测服务系统不仅支持期刊论文、学位论文、会议论文,还涵盖图书专著、科研成果、科技报告、课程作业检测等多个应用场景。这一创新性的技术在防范AI代写现象,保护学术诚信方面具有重要意义。
随着人工智能技术的飞速发展,其在学术领域的应用也日益普及。同方知网的AIGC检测服务系统为确保文本创作的真实性和学术道德的维护提供了有力工具。这一创新将有望在全球范围内推动对于AI生成文本的检测技术的研究和应用。