Patronus AI推出CopyrightCatcher API，可有效检测AI模型中的版权内容

AI每日新闻2年前 (2024)发布 shen

2,363 0 0

3月9日，专注于大语言模型（LLM）评估工具研发的Patronus AI公司正式发布了一款名为“CopyrightCatcher”的API。这款创新工具旨在检测大语言模型输出结果中是否含有侵权内容，从而帮助相关企业规避法律风险。目前，该工具的演示版本已经上线，引起了业界的广泛关注。

Patronus AI指出，当前市面上的大语言模型在训练过程中常常包含受版权保护的内容。因此，这些模型在生成文本时很容易无意中输出版权内容，给部署这些模型的企业带来潜在的重大法律风险。为了解决这一问题，Patronus AI推出了CopyrightCatcher API，为企业提供了一种有效的版权内容检测手段。 Patronus AI推出CopyrightCatcher API，可有效检测AI模型中的版权内容

据了解，为了研发这款API，Patronus AI的研究人员从Goodreads书籍平台中精心挑选了一批受版权保护的文字样本，对模型进行了对抗性训练。他们基于这些书籍创建了100则暗示语段，其中50则要求模型“生成书籍的第一段”，另外50则要求模型生成书籍中的文字片段。通过这些语段，研究人员成功地训练出了CopyrightCatcher API，使其能够检测大语言模型如何“精确地从原始训练数据复制内容”，并评估模型输出侵权内容的概率。

在API的测试阶段，研究人员对多款知名大语言模型进行了测试，包括OpenAI的GPT-4、Mistral的Mixtral-8x7B-Instruct-v0.1、Anthropic的Claude-2.1，以及Meta的Llama-2-70b-chat。测试结果显示，GPT-4在生成侵权内容方面的概率最高，达到了44%；而Claude-2.1则表现出色，生成侵权内容的概率仅为8%。这一数据为各企业选择适合自己需求的大语言模型提供了重要参考。 Patronus AI推出CopyrightCatcher API，可有效检测AI模型中的版权内容

AI旋风认为，随着人工智能技术的飞速发展，大语言模型在各个领域的应用越来越广泛。然而，版权问题一直是制约其发展的一个重要因素。Patronus AI推出的CopyrightCatcher API为解决这一问题提供了有力支持。通过使用该API，企业可以在部署大语言模型前进行充分的版权内容检测，从而有效规避法律风险，确保模型的合规使用。

此外，CopyrightCatcher API的出现也体现了人工智能技术在版权保护领域的创新应用。未来，随着技术的不断进步和完善，相信会有更多类似的工具涌现，为人工智能技术的健康发展提供有力保障。

同时，AI旋风也提醒广大企业和开发者，在使用大语言模型时务必注意版权问题。除了利用工具进行检测外，还应加强对模型训练数据的筛选和审核，确保所使用的数据不侵犯他人版权。只有这样，才能真正实现人工智能技术的可持续发展和广泛应用。