如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 直播吧
2024-06-21 02:27:41

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方 法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  但绝对自由下,也有绝对的残酷。北生所内部评估非常严苛,每5年进行一次,评估标准为学术成果是否有足够国际影响力。受邀参与评估的“国际小同行”数量至少10人,需要匿名书面回答三个问题:依据过去5年工作,北生所的课题负责人在你所在的研究所、大学能否得到晋升?这5年的研究成果,有没有对你所在的科研领域产生影响?课题负责人所做工作和今后打算要做的事情,能不能使其成为该领域中的领军人物?第一次评估,前两个问题必须通过;第二次评估,三者都要满足。首次评估通过后,实验室经费升至每年300万元,如果评估失败,实验室主任和手下全部人员都要离开。“所以我们是铁打的营盘、流水的兵,实验室主任的权责利是一致的。”王晓东说。

  另外,魏昌东提出,要注意区别是否是正常的炒股行为。据《中国纪检监察报》此前报道,党政机关工作人员可以买卖股票和证券投资基金,但应当遵守有关法律法规,并严禁七类行为。

  [海军官方宣传片《蛟龙行动》正式发布,暗藏三大“彩蛋”]22日,在海军成立74周年之际,海军官方形象片《蛟龙行动》正式发布,其中信息量巨大,暗藏三大彩蛋。

  从28岁到43岁,申军良最好的15年花在了寻子路上。他和妻子变卖了房子,花光了存款。如今,他们依然住在出租屋里,身后还欠着几十万的债。

  当天上午,秦刚与菲律宾外长马纳罗举行了会谈。在与马纳罗会谈前的公开致辞中,秦刚指出维护和加强两国关系的重要性。“中国和菲律宾是隔海相望的近邻。我们有着千年的友谊传统。”马纳罗表示,两国的分歧绝不能“阻止我们寻求有效管理分歧的方法”。他说,“我希望今天的会谈将使我们有机会落实两国领导人最近互动所取得的成果,并在解决共同问题和挑战方面取得进展。”

  朱凤莲:过去三年,民进党当局禁止大陆居民赴台、单方面关闭“小三通”、大面积取消两岸直航航点、禁止岛内旅行社开展赴大陆旅游业务等一系列禁限措施,封堵了两岸旅游发展之路。年初以来,我们采取一系列促进两岸人员便利往来的措施,受到两岸同胞肯定和欢迎。民进党当局被迫在“小三通”、恢复部分两岸直航航点问题上有所松动,但还远远不够。两岸同胞希望尽快实现两岸人员往来正常化、各领域交流常态化。民进党当局应当顺应民意,完全撤除人为障碍,采取切实措施恢复两岸双向交流和正常往来。

吴家良

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有