如何识破大语言模型“幻觉”回答?国际最新研发出“以毒攻毒”检测方法

来源: 中文网
2024-06-20 20:12:20

  中新网北京6月20日电 (记者 孙自法)基于人工智能(AI)的大语言模型(LLM)回答问题并非总是准确可靠,有时甚至极其智 能地以“幻觉”方式提供胡编乱造的答案让人真假难辨,对此如何予以有效检测广受关注。

  国际著名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员开发出一种能检测大语言模型“幻觉”的方法,这种方法通过“以毒攻毒”方式,能测量生成回答的含义的不确定性,或能用于提升大语言模型输出的可靠性。

  该论文介绍,大语言模型(如ChatGPT和Gemini)是能阅读和生成自然人类语言的人工智能系统。不过,这类系统很容易产生“幻觉”,生成不准确或没有意义的内容。检测大语言模型出现“幻觉”的程度很难,因为这些回答的呈现方式可能会让它们看起来很可信。

  现在市场需求变大,但药企提升产能并没有想象中那么简单,有些扩产需要向监管机构申报。现在多数药企采用的是“增加排班、增加设备”等方式来提升产能。

  袁洪等人在相关研究中指出,中高轨星载原子钟的功耗、尺寸、质量和成本难以适用于低轨卫星。如何依赖现有GNSS建立低轨卫星的时空基准,是业内研究的热点。

  近日在《新时代的中国北斗》白皮书发布会上,中国卫星导航系统管理办公室称,2035年前,中国将建成新一代北斗系统,其中考虑纳入低轨卫星,通过高中低轨的星座融合,提供一张覆盖全球的高精度时空网。

  医院最直接的困难是没有药品,现在只有少量的布洛芬、还有医院自己熬制的中药可以提供给村民。因为缺少资金、甚至是负债运营,这一基层医院平日里就处于缺医少药的状态。疫情管控措施放松后,感冒发烧类药品也会很快消耗殆尽。她说,“我在想,如果连布洛芬都没有了,到时病人数量又翻倍,我们该怎么办?”

  甘荣坤生于1962年5月,江西彭泽人,江西财经学院商业财会专业大学毕业。他于1983年7月参加工作后长期在国家部委任职,1989年从国家地震局调入海关总署任职,期间长期在海关总署财务司任职。1998年9月任海关总署财务科技司副司长,按照检方指控,甘荣坤的贪腐历程也就是从此开始。

  中经智盛的行业报告显示,2020年、2021年以及2022年上半年,中国的布洛芬原料药供给量分别约为1.4万吨、1.44万吨、0.74万吨,而这三年中国布洛芬原料药需求量不过约为1615吨、1723吨和1463吨。总供给量几乎达到了需求量的8-9倍,即使刨除掉出口份额(海关总署数据显示,2020年和2021年中国分别出口布洛芬8439.49吨和8110.1吨),布洛芬国内供应量也应该是十分充足的。

张美君

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有