葵司最新作品聊天机器人胡言乱语？牛津研究人员利用语义熵来识破 AI“幻觉”

2024-06-24 10:08:03　来源：葵司最新作品

IT之家 6 月 24 日消息，近年来，人工智能蓬勃发展，聊天机器人等应用逐渐普及，人们可以通过简单的指令从这些聊天机器人（例如 ChatGPT）获取信息。然而，这些聊天机器人仍然容易出现“幻觉”问题，即提供错误的答案，有时甚至是危险的信息。

造成“幻觉”的原因之一是训练数据不准确、泛化能力不足以及数据采集过程中的副作用。不过，牛津大学的研究人员另辟蹊径，在最新出版的《自然》杂志上详细介绍了一种他们新开发的方法，用于检测大型语言模型 (LLMs) 的“捏造” (即任意生成的不正确信息) 问题。

LLM 通过在训练数据中寻找特定模式来生成答案。但这种方法并非总是奏效，就像人类能从云朵形状中看到动物一样，AI 机器人也可能找到并不存在的模式。然而，人类知道云朵只是形状而已，天上并没有漂浮的巨型大象。LLM 则可能将此视为真实的，从而“捏造”出并不存在的新科技和其他虚假信息。

牛津大学的研究人员利用语义熵的概念，通过概率来判断 LLM 是否出现“幻觉”。语义熵指的是同一个词语拥有多种含义的情况，例如，“desert”可以指沙漠，也可以表示抛弃某人。当 LLM 使用这类词语时，可能会对表达的含义感到困惑。通过检测语义熵，研究人员旨在判断 LLM 的输出内容是否存在“幻觉”的可能。

利用语义熵的优势在于无需额外的监督或强化学习，即可快速检测 LLM 的“幻觉”问题。由于该方法不依赖于特定任务的数据，因此即使 LLM 面临从未遇到过的新任务，也能加以应用。这将大大提升用户对于 LLM 的信任感，即使是 AI 首次遇到某个问题或指令。

研究团队表示：“我们的方法可以帮助用户理解何时需要对 LLM 的输出保持谨慎，并为原本因不可靠性而受限的 LLM 应用开辟了新天地。”

如果语义熵被证明是一种有效的“幻觉”检测手段，那么我们可以利用这类工具对人工智能的输出进行双重校验，使其成为更加可靠的伙伴。不过IT之家需要提醒的是，就像人类并非无懈可击一样，即使配备了最先进的错误检测工具，LLM 也仍然可能出错。因此，始终对 ChatGPT 等聊天机器人提供的答案进行仔细核查仍然是明智之举。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

【编辑:王嘉豪】

更多精彩内容请进入文化频道

文化新闻精选：

克里米亚大桥爆炸，影响几何？

2024-06-24 10:08:03
美国高级官员与阿富汗塔利班代表举行面对面会谈

2024-06-24 10:08:03
推特公司拒绝马斯克以440亿美元原价收购该公司

2024-06-24 10:08:03
浙江10月2日新增本土新冠阳性7例

2024-06-24 10:08:03
C919获发适航证，准备起飞的还有万亿元产业链

2024-06-24 10:08:03
SPACEX与NASA成功发射载人航天飞船

2024-06-24 10:08:03
DR钻戒的“爱情买卖”

2024-06-24 10:08:03
WTO预计明年全球贸易大幅放缓，衰退风险加剧

2024-06-24 10:08:03
国庆露营让预制菜翻红预制菜赛道春天来了？

2024-06-24 10:08:03
乌克兰官员：基辅遭到袭击已造成8死24伤

2024-06-24 10:08:03

日本黄小游戏免费网站	亚洲色图欧美色
学生的粉嫩小泬10p久	男生舔女生爽上天软件

喷水av	男生捅女生机机
七月丁香婷婷	亚洲做受高潮软件

葵司最新作品聊天机器人胡言乱语？牛津研究人员利用语义熵来识破 AI“幻觉”

葵司最新作品聊天机器人胡言乱语？牛津研究人员利用语义熵来识破 AI“幻觉”

相关新闻：

文化新闻精选：