亚洲乱强伦乂

如何识破大语言模型“幻觉”回答？国际最新研发出“以毒攻毒”检测方法

来源：半月谈

　　中新网北京6月20日电 (记者孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠，有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨，对此如何予以有效检测广受关注。

　　国际著名学术期刊《自然》最新发表一篇人工智能研究论文称，研究人员开发出一种能检测大语言模型“幻觉”的方法，这种方法通过“以毒攻毒”方式，能测量生成回答的含义的不确定性，或能用于提升大语言模型输出的可靠性。

　　该论文介绍，大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过，这类系统很容易产生“幻觉”，生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难，因为这些回答的呈现方式可能会让它们看起来很可信。

展开剩余89%

　　陈树隆的所作所为不仅坑了自己，还带坏了妻子、弟弟、侄女等人。据检方指控，陈树隆是直接或通过其妻子王传红、弟弟陈树堂等人收受财物。

　　物流速度“快”了起来，电商增长却“慢”了下来。随着电商平台增长放缓，行业进入存量竞争阶段，根据国家统计局数据显示，2022年全国网上零售额13.79万亿元，同比增长4%，上一年这一数字则是14.1%。

　　近几年频繁的沙尘暴天气，是否意味着我们进入了沙尘活跃期？对此，受访专家们表示还无法给出准确判断。“气候系统里面有个周期性的变化，但是这种周期性的变化现在实际上并不是特别清楚，基于几年的短期情况，很难判断出趋势。”中国科学院大气物理研究所副研究员吴成来告诉《中国新闻周刊》。

　　“中国有14亿多人，约占世界人口近1/5。如何把这么多人的意愿表达好、凝聚好以及落到实处？中国找到了‘全过程人民民主’这把金钥匙。”

　　除此之外，信息消费联盟理事长项立此前对《环球时报》记者表示，美光在中国销售的产品可能存在安全问题，比如被操纵、数据泄露，以及其他法律法规禁止的行为。中国政府完全有权力进行监管、审查，确认这些产品是否合乎中国的安全要求。项立刚认为，以前，中国市场对美光的依赖性较高，很多芯片由美光供应。但是近年来，由于美国对中国高科技企业实施制裁，美光等制造商对中国的供应出现问题；同时，长江存储等中国企业也成长起来，中国对美光的依赖程度大大降低，许多器件基本可以实现自给自足。

　　博世集团董事会主席史蒂凡·哈通在CDF年会上也提到，他们非常依赖在中国的供应链，数字化是另一个重要因素，它可以打造供应链的韧性。“实时数据可以让我们更好利用全球产能，监测运输进展，最终使我们能够更加容易适应市场的变化。”

郑耀礼

声明：该文观点仅代表作者本人，搜狐号系信息发布平台，搜狐仅提供信息存储空间服务。

阅读 (0)