如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 海报新闻
2024-06-21 11:40:09

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性 。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  类似的紧急情况还有很多,杜娟的辖区内有一个需要定期做血透的病人,在前一天已经血透完了的情况下,第二天核酸测出是阳性,并开始咳嗽,“然后可能是引发了其他的一些并发症,他整个人就陷入了昏迷。”杜鹃接到求助后,紧急上门给这位病人检查,发现病人意识已不清醒,虽然及时送到了定点医院,但最后这名病人还是情况不好,又进了ICU。

  这些能在细分市场占据领先地位的中小企业,成功的背后都有着一个共同的秘密武器——“专利信息”。天眼查数据显示,第四批专精特新“小巨人”企业创新性强,研发投入高,企业平均研发经费占营业收入比重10.4%,平均拥有I类知识产权16项、发明专利14项。

  长沙的“米”字形高铁网也尚未建成,已建成的有京广高铁(一“竖”)、沪昆高铁(一“横”)、湘桂高铁(左下一“撇”),常益长高铁(一“点”)益长段——与长赣铁路、赣厦高铁构成渝厦高铁。

  在这一领域,北京之外,上海拥有明显优势,已建和在建的国家重大科技基础设施达14个,遥遥领先。2021年,上海出台《关于加快推动基础研究高质量发展的若干意见》,其目标是,到2025年,基础研究经费支出占全社会研发(R&D)经费支出比例达到12%左右,力争在若干重要基础研究领域成为世界领跑者和科学发现新高地。

  一些博彩公司,开出的玩法更是多种多样,有些甚至超出常人思维。比如,因为乌拉圭球星苏亚雷斯有过“球场咬人”的前科,2014年巴西世界杯前夕,瑞典有一家博彩公司对苏亚雷斯是否会在世界杯上咬人开出了赌盘,而且赔率高达175倍。

  上述负责人对第一财经记者表示,武昌土储中心近日已对机电院项目的18亿元征收补偿款审计结果进行了确认并负责,拟与市土储中心签订补充协议,市土储中心已向上级主管部门报批,“这4亿元的资金,我们已经准备就绪,待上级部门作出决议并履行相应职责程序后即可完成,力争下周可履约付款”。

陈信瑶

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有