人工智能最新研究:一种大语言模型加上评价框架带来新数学发现

来源: 中青网
2024-06-06 23:09:24

  该论文介绍,基于人工智能的工具(例如LLM)有望加速科学发现,解决长久存在的问题,但它们有时受制于“幻觉”,导致作出看似合理但错误的陈述。加入一个评估步骤,系统地衡量潜在解决方案的准确性,使得靠LLM帮助应对复杂问题成为可能。这些问题一般需要可验证且定义明确,使这一工具在数学科学中有潜在价值。

  论文第一作者和通讯作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi与同事及合作者一起提出一种方法,称为FunSearch(因为它搜索函数空间),将一组产生创造性解决方案的LLM和一个作为检查者以避免错误建议的评估程序结合起来。一个多次迭代此过程的演化方法,通过提供此前最佳解决办法作为输入来引导LLM,结果表明这种方法可以收敛到新的、可验证的正确结果。他们将FunSearch应用到了著名的上限集问题(cap set problem,数学中涉及计数和排列领域的一个中心问题),发现了超越最 著名上限集的大上限集新构造

  论文作者认为,FunSearch的成功关键是它会寻找描述如何解决一个问题的程序,而非寻找解决办法。因为FunSearch的结果是程序,结果易于人类解释和验证,这意味着该方法有望激发该领域的进一步思考。

  接近杭州市政府部门的工作人员向《中国新闻周刊》透露,为优化营商环境,“店小二式的服务”一直被杭州市强调,要从企业提出需求政府再回应的“响应式”服务,转变为主动服务。“产业政策也一样,主动根据企业发展需要来制定。”在沟通上,各部门与企业的对接更密切、频繁,部分街道也与企业加深联系。

  铁路郑州站消息,2月26日至3月14日,乘坐进京列车的旅客将进行二次安检。郑州火车站进京列车具体候车区域安排如下:第一候车厅:1304、Z396、Z286、Z54、T290、K600、K818、K508、K22、K150、K118、K158、K180、K402、Z38、Z502、Z162、Z2、K268、T146、Z6、Z50 、Z4、Z96、T10、Z336、T168、Z78、K262、T50、G96、G1585/8、K968、Z836。

  “阿里巴巴的基数太大,很多数据依靠阿里巴巴的增长体现,比如网络零售总额、社会零售总额、跨境电商交易额、外贸数据、人才引进等等。”有熟悉余杭区经济发展的人士表示,要填补大企业波动带来的空缺,并非易事。

  另据微信公号“国防大学”2月21日消息,“肖天亮校长等大学领导多次深入试讲课堂一线检查指导”。此前,肖天亮是国防大学副校长。这意味着,肖天亮已出任国防大学校长。

  其中,郑庆华本硕博均毕业于西安交通大学,破格晋升为副教授、教授,跨省履新同济大学前,任西安交通大学党委常委、副校长。续梅长期在教育部下属媒体机构工作,执掌北京邮电大学前,任教育部新闻办主任、教育部办公厅巡视员,教育部新闻发言人。

  [环球时报-环球网报道 记者陈青青]在2月28日举行的外交部例行记者会上,有记者提问,刚刚中国外交部发布了秦刚部长将出席二十国集团外长会的消息,能否介绍一下具体的情况以及中方对此次外长会的期待?

张美君

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有