各大AI模型训练成本大比拼:谷歌Gemini Ultra高达1.9亿美元

来源: 慧聪网
2024-06-05 20:47:32

  随着计算需求的增加,训练它们所需的计算能力的费用也在飙升。为此,AI公司正在重新考虑如何训练这些生成式AI系统。在许多情况下,这些策略包括在当前的增长轨迹下降低计算成本。

  训练成本是如何确定的?

  斯坦福大学与研究公司Epoch AI合作,根据云计算租金估算了AI模型的训练成本。双方所分析的关键因素包括模型的训练时长、硬件的利用率和训练硬件的价值。

  尽管许多人猜测,训练AI模型的成本变得越来越高,但缺乏全面的数据来支持这些说法。而斯坦福 大学发布的《2024年AI指数报告》正是支持这些说法的罕见来源之一。

  不断膨胀的训练成本

  下表展示了自2017年以来,经通胀调整后的主要AI模型的培训成本:

  去年,OpenAI的GPT-4培训成本估计为7840万美元,远高于谷歌PaLM (540B) 的训练成本。谷歌PaLM较GPT-4仅早一年推出,但训练成本为1240万美元。

  相比之下,2017年开发的早期AI模型Transformer的训练成本为930美元。该模型在塑造当前所使用的许多大型语言模型的体系结构方面起着基础性作用。

  谷歌的AI模型Gemini Ultra的训练成更高,达到了惊人的1.91亿美元。截至2024年初,该模型在几个指标上都超过了GPT-4,最引人注目的是在“大规模多任务语言理解”(MMLU)基准测试中胜出。这一基准是衡量大型语言模型能力的重要标尺。例如,它以评估57个学科领域的知识和解决问题的熟练程度而闻名。

  训练未来的AI模型

  鉴于这些挑战,AI公司正在寻找新的解决方案来训练语言模型,以应对不断上涨的成本。

  其中的方法有多种,比如创建用于执行特定任务的较小模型,而其他一些公司正在试验创建自家的合成数据来“投喂”AI系统。但到目前为止,这方面还没有取得明确的突破。

  例如,使用合成数据的AI模型有时会“胡言乱语”,引发所谓的“模型崩溃”。

责任编辑:刘明亮

  随着国内对于疫情防控政策的调整,天津滨海机场正在全力推动航线航班的恢复运行。自2022年四季度开始,天津滨海机场陆续新开加密恢复多条国内、国际及地区航线,国内方面恢复了至广州、长沙、西安、内蒙古等地的航线航班,国际及地区方面新开加密了至香港、曼谷、东京、大阪、河内、贝尔格莱德多条客运定期航线,满足旅客的出行需求。

  “我们将牵线、协调优质师资力量参与到社区的公益文体教学。”唐文胜主动交换了联系方式,并及时做好记录。

  调查发现,少年儿童认为学校的榜样教育主要存在“对榜样的宣传太死板”(23.6%)、“榜样千篇一律没有个性”(23.5%)、“榜样离太远起不到激励作用”(23.4%)等问题,比例均在两成以上。

  晚8时,陈敏瑞和夜班的同事交接过任务后,终于结束了12个小时的工作。整整一天,除了吃饭,她几乎很少起身,桌上的水杯基本没怎么端起来过,之所以有这些习惯,都是为了“以防万一”。“我和患者从不见面,就靠一条电话线连着。每当在电话里帮助患者完成一次心肺复苏的医学指导,或者成功协助110、119完成伤员抢救任务,我都特别有成就感。”陈敏瑞说,最近1个多月,120急救电话处于高位运行,他们身上的担子比以前更重了。“所有人实行12小时白班、夜班两班倒工作制,为了不耽误工作,大家都是刚刚‘阳康’就立马投入工作,全都坚守在调度席接听电话。”

  不过,阵容与制作的升级,却没能带来超越第一季的火爆程度。作为唱跳类舞台节目,资深艺人“刷脸”带来的热度并不持续,如何激励他们创作呈现更具有时代感的作品,或许能为节目带来新的活力。

  上海市卫健委方面表示,目前,社区新冠救治与防重症能力得到持续提升。据了解,自2022年12月29日第二轮扩容增能以来,到2023年1月2日为止,全上海的社区卫生服务机构新增1711个吸氧位、2562个输液位,238间发热诊间、665张病床、243台心电监护仪;同时,抗病毒药物(小分子药物)、指氧仪、氧气罐等物资优先向社区倾斜配备。

林诗雅

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有