如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 中国文明网
2024-06-21 04:45:09

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型 出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可

  近日,据多家媒体报道,中石油旗下寰球工程项目管理(北京)有限公司的执行董事、党委书记、总经理胡某勇在闹市与一名女子逛街,两人亲密牵手的动作被一名街拍摄影师拍下后发布到网上,引发大量网友关注。6月8日,据华商报大风新闻报道,中国石油北京项目管理公司宣布涉事两人均停职,接受纪委调查。上游新闻(报料邮箱baoliaosy@163.com)记者搜索发现,疑似“牵手门”女当事人董某某的社交媒体账号也被网友扒出,虽然已经删掉全部内容并销号,但很多涉嫌炫富的内容已经被网友截屏转发。

  从历史上看,中美在气候变化问题上均有合作需求,但未能取得实质性进展,归根结底在于两国对彼此在气候问题上应该承担的责任有不同的认识。

  随着蚂蚁集团完成相关整改事项,进一步夯实合规治理水平、加强风险管理能力,有市场人士预计后续蚂蚁集团申设金控公司、申请征信等业务牌照的进度或将加快。

  [#微信官方回应显示已读#:放心,没有如果]#微信称不会显示已读# 7月12日,针对网友讨论#如果微信显示已读的话# , @腾讯微信团队 回应称:放心,没有“如果”。

  中央社会工作部划入民政部的指导城乡社区治理体系和治理能力建设、拟订社会工作政策等职责,统筹推进党建引领基层治理和基层政权建设。划入中央和国家机关工作委员会、国务院国有资产监督管理委员会党委归口承担的全国性行业协会商会党的建设职责,划入中央精神文明建设指导委员会办公室的全国志愿服务工作的统筹规划、协调指导、督促检查等职责。

  看我们外交部的新闻稿,用了“应约”两个词。如果我没猜错的话,这应该是美方主动提议。美方最近确实很主动,国务卿布林肯上个月访问了北京,美国财长耶伦日前又来到中国。

许俊来

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有