如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 三联生活周刊
2024-06-21 19:08:33

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Ge mini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  这是一个不寻常的冬季,进入12月,原本就是忙碌时节的北京各大医院、涌入更多赶来就医的患者,为应对可能到来的医疗挤兑,2022年12月10日起,北京市349家社区卫生服务中心开始为发热等11类症状患者提供诊疗服务,实施分类处置。作为基层医务工作者,段文燕和同事们,第一次与新冠正面作战。

  <strong>个人出行</strong>

  “办理业务不?检车,还是上牌?驾考也能包过……”举着“代办”牌子、发着小卡片,到车管所办事者,有时会遇到一些“有内部人”的中介——他们把正常业务渲染成非托人不成,或以造假手段从中牟利……

  养老院:入院人员须查48小时核酸、现场抗原

  每名旅客只能随身携带安全火柴不超过2小盒,普通打火机不超过2个。

  在上海虹桥开往长沙南的G586次列车上,乘务员给乘车的小旅客们送上了一份小礼物——秋梨膏棒棒糖。

王佑诚

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有