尽管许多人使用它,但 OpenAI 因其广受批评的“准确率低”而将其退役。

人工智能生成的文本具有一些可以可靠检测的识别特征或模式的理论似乎很直观,但到目前情况为止,这一点尚未在实践中得到真正证实。尽管某些生成的文本可能有显然的信息,但大型语言模型之间的差异及其发展的速度使得这些信息差不多不可能依赖。

TechCrunch 对一系列人工智能写作检测工具的测试得出的结论是,它们充其量是命中或失败,最坏的情况是完全毫无价值。在提供给各种检测器的七个生成的文本片段中,GPTZero 正确识别了五个,而 OpenAI 的分类器仅正确识别了一个。那是一种即使在当时也不是前沿的语言模型。

但有些人只相信检测的表面意义,或者更确切地说,远远高于它的表面意义,因为 OpenAI 提供的分类器工具有一系列显然的限制,以至于人们想知道他们为什么要把这个东西推出来。那些担心学生、求职者或自由职业者提交生成文本的人会将其放入分类器中进行测试,虽然结果不应该被信任,但有时他们确实如此。

鉴于语言模型只是不断改进和激增,似乎该公司决定是时候让这个变化无常的工具下线了。“我们正在努力纳入反馈,目前情况正在研究更有效的文本来源技术,”分类器公告帖子的 7 月 20 日附录中写道。

文章翻译自:techcrunch;原文链接:https://techcrunch.com/2023/07/25/openai-scuttles-ai-written-text-detector-over-low-rate-of-accuracy/

发表评论