各大AI模型训练成本大比拼:谷歌Gemini Ultra高达1.9亿美元

来源: 网易网
2024-06-05 20:12:08

  随着计算需求的增加,训练它们所需的计算能力的费用也在飙升。为此,AI公司正在重新考虑如何训练这些生成式AI系统。在许多情况下,这些策略包括在当前的增长轨迹下降低计算成本。

  训练成本是如何确定的?

  斯坦福大学与研究公司Epoch AI合作,根据云计算租金估算了AI模型的训练成本。双方所分析的关键因素包括模型的训练时长、硬件的利用率和训练硬件的价值。

  尽管许多人猜 测,训练AI模型的成本变得越来越高,但缺乏全面的数据来支持这些说法。而斯坦福大学发布的《2024年AI指数报告》正是支持这些说法的罕见来源之一。

  不断膨胀的训练成本

  下表展示了自2017年以来,经通胀调整后的主要AI模型的培训成本:

  去年,OpenAI的GPT-4培训成本估计为7840万美元,远高于谷歌PaLM (540B) 的训练成本。谷歌PaLM较GPT-4仅早一年推出,但训练成本为1240万美元。

  相比之下,2017年开发的早期AI模型Transformer的训练成本为930美元。该模型在塑造当前所使用的许多大型语言模型的体系结构方面起着基础性作用。

  谷歌的AI模型Gemini Ultra的训练成更高,达到了惊人的1.91亿美元。截至2024年初,该模型在几个指标上都超过了GPT-4,最引人注目的是在“大规模多任务语言理解”(MMLU)基准测试中胜出。这一基准是衡量大型语言模型能力的重要标尺。例如,它以评估57个学科领域的知识和解决问题的熟练程度而闻名。

  训练未来的AI模型

  鉴于这些挑战,AI公司正在寻找新的解决方案来训练语言模型,以应对不断上涨的成本。

  其中的方法有多种,比如创建用于执行特定任务的较小模型,而其他一些公司正在试验创建自家的合成数据来“投喂”AI系统。但到目前为止,这方面还没有取得明确的突破。

  例如,使用合成数据的AI模型有时会“胡言乱语”,引发所谓的“模型崩溃”。

责任编辑:刘明亮

  杨道玲:高频指标显示,2023年我国外贸实现良好开局。

  据悉,为积极稳妥做好出境旅游团通关保障工作,宁波机场出入境边防检查站推出多项举措,主动与航司、旅行社沟通,提前掌握出境旅游团规模,优化通关流程,增派台外引导警力,帮助旅客正确选择团体检查通道,节省候检时间。(完)

  据此前报道,2022年12月,Neuralink因可能在动物实验过程中违反动物福利法规定,面临美国联邦调查。当时有员工表示,由于马斯克要求加快研究速度,对动物造成了不必要的痛苦和死亡。

  <a target='_blank' href='/'>中新社</a>北京2月10日电 (记者 王恩博)中国国家统计局10日公布的数据显示,1月份,受国际原油价格波动和国内煤炭价格下行等因素影响,中国工业品价格整体继续下降。

  “一人富不是富,户户兴才是兴。我希望能带领乡亲们一起改变家乡贫穷落后的面貌。”2014年,身在外乡的经商能人庹明合毅然放弃了城里红火的生意,回到郧阳区五峰乡东峰村,担任村党支部书记。

  《证券期货业信息系统渗透测试指南》金融行业标准提供了一套通用的信息系统渗透测试框架,为在渗透测试策划、设计、执行、结果以及风险管理等环节,保障测试质量、控制安全风险提供了操作指南。标准的实施将有利于规范行业机构安全、稳定地开展渗透测试工作,强化信息系统安全运行保障,提高行业网络安全防护能力,助力资本市场平稳运行。

罗元发

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有