如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 慧聪网
2024-06-21 12:45:58

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言 模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信

  辽宁大学美国与东亚研究院教授吕超告诉“补壹刀”,现在韩国媒体炒作对华不友好氛围,破坏中韩友好关系,以完全没有的事,通过制造谣言的方式渲染造成负面效果。

  “现在三班倒,我们27名护士,只能收到18个病人,就撑死了。”李刚告诉记者,“ICU的医疗安全、护理安全,跟人力资源是密切相关的。人力资源的缺乏,跟ICU的病死率是密切相关的。”

  他在感染之后,身体状态也明显不如往日,甚至在带病工作多日后出现呼吸困难、咳血,他一直没去拍CT。“没敢,你要真成了新冠肺炎,肯定得休息了,撑着吧。”秦宇红说。

  “现在除了四人间套房还没有被预订,其余的房型都已经被订完了。”北京昌平某私汤度假酒店的客服告诉记者,“每年元旦的时候,房间预订都比较火爆,提前一个月预订才比较保险。”

  由于技术受限,台军很多设备和零部件都无法自行生产,为此遭遇的尴尬事着实不少。2022年2月,有岛内媒体披露称,台“立法院”通过2400亿元新台币的“海空战力提升计划采购特别条例”后,台防务部门在北中南等地兴建12个导弹阵地。结果由“中科院”研发、专门追监解放军军机的“天弓”导弹与导弹阵地等武器系统重要零组件重大标案出错,一些重要零件还“混入大陆零件”,部分甚至在淘宝就能买到。

  “其实病情不会突然变重,”上海一三甲医院的呼吸科副主任刘可敬告诉记者,“在抢救资源准备充足的前提下,普通肺炎给予有效治疗,他就不会转成重症。”

王香恭

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有