专门开发大语言模型(LLM)评估工具的Patronus AI最近发布了一款名为“CopyrightCatcher”的API,旨在帮助企业检测大语言模型输出中的侵权内容,以减少法律风险。
解决侵权问题
市面上的大语言模型经常会输出受版权保护的内容,这为企业部署相关模型带来了重大法律风险。为了解决这一问题,Patronus AI推出了CopyrightCatcher API,可用于检测大语言模型输出中的侵权内容。
训练与测试
Patronus AI的研究人员从Goodreads书籍平台中抽取了一批受版权保护的文字样本,进行了对抗性训练,并建立了100个暗示语段作为测试。其中50个要求模型生成书籍的第一段,另外50个要求生成书籍中的文字片段。
CopyrightCatcher API功能
CopyrightCatcher API可以检测大语言模型如何从原始训练数据中复制内容,并评估模型输出侵权内容的概率。这一工具为企业提供了侵权内容检测的解决方案,降低了法律风险。
测试结果
研究人员使用了几种主流大语言模型进行测试,结果显示GPT-4最容易生成侵权内容,而Claude-2.1最难生成侵权内容。
GPT-4:44%
Mixtral-8x7B-Instruct-v0.1:22%
Llama-2-70b-chat:10%
Claude-2.1:8%
CopyrightCatcher API为企业提供了一种有效的侵权内容检测工具,有助于保护知识产权,降低法律风险,是企业在部署大语言模型时的重要辅助。