如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 川观新闻
2024-06-21 10:23:14

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方 式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  来自北京的戴先生一家三口专程赶来周庄感受不一样的江南年俗。一家人陆续摸了春牛,脸上洋溢着满足的笑容。这个春节假期,广东的刘女士带着家人准备来一个“古镇深度游”,周庄、乌镇、西塘等水乡古镇都在她的“打卡”表上。住进周庄的民宿感受苏州的“人家尽枕河”、品着莼菜羹体味吴地的“莼鲈之思”,在江南的朦胧烟雨中,刘女士一家开心地享受着假期。

预计将保障航班超过3.4万架次

  小品《坑》讽刺了“躺平式”干部的不作为。小品《马上到》通过一个因职业身份临时互换的故事,聚焦人与人之间的宽容理解。小品《对视50秒》引发用真心真意对待身边爱人的共鸣。小品《上热搜了》讲述了一段因网络视频引发的两个家庭从误会到理解的故事。

  <strong>托克逊县公安局交警大队小草湖中队交警 周正闯:</strong>这边天气太冷了,没办法这个。

  从作为基本养老保险制度补充的个人养老金看,2022年11月25日,个人养老金制度在36个城市或地区先行启动实施。截至2022年末,个人养老金参加人数1954万人,缴费人数613万人,总缴费金额142亿元。

  20点51分,列车抵达终点站吉林站,李欣却还不能回家过年。返回职工宿舍休息一晚后,她又将值乘下一班列车,继续春运里的坚守。

竺冠宇

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有