如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 半月谈
2024-06-21 16:32:42

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一 篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  陈树隆的所作所为不仅坑了自己,还带坏了妻子、弟弟、侄女等人。据检方指控,陈树隆是直接或通过其妻子王传红、弟弟陈树堂等人收受财物。

  物流速度“快”了起来,电商增长却“慢”了下来。随着电商平台增长放缓,行业进入存量竞争阶段,根据国家统计局数据显示,2022年全国网上零售额13.79万亿元,同比增长4%,上一年这一数字则是14.1%。

  近几年频繁的沙尘暴天气,是否意味着我们进入了沙尘活跃期?对此,受访专家们表示还无法给出准确判断。“气候系统里面有个周期性的变化,但是这种周期性的变化现在实际上并不是特别清楚,基于几年的短期情况,很难判断出趋势。”中国科学院大气物理研究所副研究员吴成来告诉《中国新闻周刊》。

  “中国有14亿多人,约占世界人口近1/5。如何把这么多人的意愿表达好、凝聚好以及落到实处?中国找到了‘全过程人民民主’这把金钥匙。”

  除此之外,信息消费联盟理事长项立此前对《环球时报》记者表示,美光在中国销售的产品可能存在安全问题,比如被操纵、数据泄露,以及其他法律法规禁止的行为。中国政府完全有权力进行监管、审查,确认这些产品是否合乎中国的安全要求。项立刚认为,以前,中国市场对美光的依赖性较高,很多芯片由美光供应。但是近年来,由于美国对中国高科技企业实施制裁,美光等制造商对中国的供应出现问题;同时,长江存储等中国企业也成长起来,中国对美光的依赖程度大大降低,许多器件基本可以实现自给自足。

  博世集团董事会主席史蒂凡·哈通在CDF年会上也提到,他们非常依赖在中国的供应链,数字化是另一个重要因素,它可以打造供应链的韧性。“实时数据可以让我们更好利用全球产能,监测运输进展,最终使我们能够更加容易适应市场的变化。”

郑耀礼

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有