如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 重庆华龙网
2024-06-20 14:32:18

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类 语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很

此前阿根廷球星梅西曾确认,这将是他的最后一届世界杯……

这是35岁的梅西第五次世界杯之旅。2006年,初出茅庐的“小将”梅西与阿根廷队在四分之一决赛中被东道主德国队点球大战击败;四年后的南非世界杯,又是德国,梅西与“潘帕斯雄鹰”再次被挡在了半决赛之外;2014年,梅西终于在巴西世界杯中踏上了决赛的场地,还是德国人——格策的加时赛“绝杀”粉碎了梅西近在咫尺的冠军梦;上届俄罗斯世界杯,阿根廷队被法国队击败,早早止步于16强。

过去数十年,飞速发展的中国经济吸引了大量外国商人来华从事跨国贸易活动。他们的跨国经济行为以及由此引发的各种社会现象,引起了社会各界的广泛关注。然而,跨文化群体之间经济交往背后涉及的信用以及贸易纠纷的解决问题,一直被社会所忽视。有学者认为中国是个低信任国家,低信任不仅增加了交易成本,对经济和社会的损害也显而易见。因此,如何处理好跨文化群体间的信用问题以及由此产生的贸易纠纷,不仅是外国企业引进来,也是中国企业走出去必然会面临且亟待解决的问题。

来源:荔枝网

在各大社交媒体平台上,至今仍流传着卡塔尔“壕”无上限的细节:有游客胃出血需要住院治疗,都准备好钱包“大出血”了,谁知出院后只用付给医院6卡币,约合人民币12元。有当地人感慨“我这么有钱,照样每天工作三小时”被网友围观,而这恰是卡塔尔人的生活现状:他们每天只需工作3小时,就能拿上百万元的年薪。

卡塔尔世界杯开幕在即,这将是球迷们的一次盛宴。对于中国球迷来说,这届世界杯有一件让人津津乐道的事情,那就是“中国提供了除了球队之外的一切”:场馆、设备、配套设施、纪念品,甚至还有裁判参与比赛的执哨。然而,这届世界杯没有能够逃过西方一些批评人士的指责,宣称“卡塔尔缺乏人权保障”。

黄易湖

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有