如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 中国小康网
2024-06-21 05:30:02

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检 测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  当地时间1月8日至1月9日,欧洲理事会主席米歇尔、欧盟委员会主席冯德莱恩、欧洲议会议长梅措拉和欧盟外交和安全政策高级代表博雷利分别发文,强烈谴责冲击巴西国会等机构的行为,向巴西总统卢拉表达支持。

  基于新冠病毒感染实施“乙类乙管”,中国官方近日发布第十版诊疗方案。相比十个月前发布的第九版诊疗方案,新版方案有何特点?针对当前备受关注的“一老一小”医疗救治有何优化?中国国务院联防联控机制1月9日举行发布会,就此作出解读。

  作为疫情防控进入新阶段后的首个春运,2023年的春运在回归的“烟火气”中开启。国务院联防联控机制春运工作专班数据显示,春运首日全国铁路、公路、水路、民航共发送旅客3473.6万人次,环比增长11.1%,比2022年同期增长38.9%。

  部分资金获利了结

<strong>  何威:</strong>经过多年努力,中国已在游戏领域建立了相对完善的未成年保护体系,从网游内容审核机制、网游实名制度、限制未成年人游戏时长和充值消费,到推行《网络游戏适龄提示》团体标准、企业接入实名认证平台并主动用技术手段验证、建立家长监护平台、开通未保服务专线、推出未成年人充值退款自助系统等。应当说,在全社会关注下和主管部门要求下,中国游戏行业已采取了较为全面和严格的限制措施。

  上周A股迎来“开门红”。A股ETF全面上涨,总成交额1773.47亿元。不过,随着行情回暖,不少此前在市场下跌期间“抄底”的ETF选择落袋为安,以区间成交均价估算,上周A股ETF资金净流出约95.62亿元。

张珊云

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有