阿里降价97%,百度免费 大模型价格战打得比“618”还猛

来源: 中国汽车报
2024-05-22 08:46:26

【TechWeb】5月20日,电商年中大促“618”正式开启,各家电商平台还在忙着统计首日战报,大模型价格战已经率先打响,甚至比618还要猛烈。

21日上午,阿里云抛出重磅炸弹,通义千问GPT-4级主力模型Qwen-Long,API(应用程序编程接口)输入价格从0.02元/千Tokens降至0.0005元/千Tokens,直降97%,相当于GPT-4价格的约1/400。

上周,字节跳动发布豆包大模型,并宣布豆包通用模型pro-32k版的推理输入价格为0.0008元/千Tokens,首次将大模型价格带入“厘时代”。如今,通义千问的价格比豆包大模型还要便宜。

按照上述价格计算,1元能买到豆包主力模型的125万Tokens,相当于3本《三国演义》,而1元也可以买到通义千问主力模型的200万Tokens,相当于5本《新华字典》。

这还没完,当天下午,百度直接宣布,旗下两款大模型ERNIE Speed、ERNIE Lite免费。这两款产品是今年3月百度推出的“轻量级”大模型,相比通用大模型,轻量级大模型的推理成本也会更低。

那么,问题来了,字节、阿里、百度三家大厂已相继宣布大模型降价,腾讯会不会跟进?

日前,腾讯云副总裁、腾讯云智能负责人吴运声在接受采访时,没有明确回答是否会加入大模型价格战,他表示,“腾讯更关注大模型能力的提升,致力于为行业提供能力和价格兼具的产品。”

从卷技术到卷价格

前两年,大模型公司还沉浸在拼参数量、拼文本长度。今年以来,整个行业从卷技术到卷价格,大模型降价已成趋势。

在字节等大厂纷纷宣布降价之前,已经有不少厂商下调大模型使用价格。

5月6日,AI公司DeepSeek发布全新第二代MoE大模型DeepSeek-V2,该模型API定价为:每百万Tokens输入1元、输出2元(32K上下文),仅是GPT-4的近百分之一。

5月11日,智谱大模型官宣新的价格体系,入门级产品GLM-3 Turbo模型调用价格从5元/百万Tokens降至1元/百万Tokens,降幅高达80%。

这样的趋势,同样在国外发生。今年2月底,法国AI公司Mistral AI发布最新大模型Mistral Large,该模型输入、输出价格比GPT-4 Turbo便宜约20%。

而自去年以来,OpenAI已经进行了4次降价,其最新发布的多模态大模型GPT-4o,不仅性能有了很大提升,价格也下调了50%。

降价背后是大模型结构、训练等成本的持续优化。李彦宏曾在Create 2024百度AI开发者大会上透露,与一年前相比,文心大模型推理性能实现了105倍增长,而推理成本却降到了原来的1%。

今日,创新工场董事长兼CEO李开复在接受媒体采访时表示,在一定程度上,整个行业每年降低10倍推理成本,这是可以期待的,而且是必然也应该发生的。“今天可能是处在一个比较低的点,但是我觉得如果说以后大约有一年降价10倍来看的话,这是一个好消息,对整个行业都是好消息。”

此外,火山引擎总裁谭待也曾表示,市场对降价的呼声比较高,平台必须把试错成本做到非常低,才能让大家用起来。只有大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。

为什么要打价格战?

现在,大模型还是一个高投入、低产出的行业,为什么厂商还要打价格战?答案也很简单:加速商业化落地。

大模型卷到2024年,一个新的赛季已经打响,应用场景的落地成为竞争主旋律。大模型定价的持续走低有望带来更快的商业化落地。

上周,OpenAI、谷歌、字节跳动、腾讯四家大厂相继披露在大模型领域的最新进展,无一不聚焦在应用侧。

硬核如OpenAI,对于最新发布的多模态大模型GPT-4o,也没有以往对参数指标的生硬强调,而是选择集中展示多场景下的用户体验。这被认为是OpenAI加速应用落地的表现。

在腾讯云生成式AI产业应用峰会上,吴运声在谈及大模型商业化的问题时表示,技术的突破未来一定会带来商业化的机会,而且会呈现跨越式的增长态势。AI要真正落地实用,推理成本的降低、工程性能的极致优化至关重要,是未来商业化取得突破的重要因素。

当天,腾讯集团副总裁蒋杰在大会上宣布,腾讯混元大模型通过持续迭代,目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。

值得一提的是,目前大模型的应用还在早期阶段,仍有很大的发展空间。QuestMobile数据显示,截至今年3月,基于大模型的AIGC行业用户量为7380万,尽管同比增长了8倍,也仅占移动互联网用户量的6%。

海通证券5月17日研报指出,伴随国产AI大模型的持续升级,2024年有望成国产AI大模型全面商业落地的元 年,先进的AI大模型能力也将逐渐转化为落地实际场景的产品应用,从而带动AI大模型在金融、教育、法律、医疗等众多垂直行业的持续落地,AI2B与AI2C的需求天花板也有望全面打开,在这个过程中,AI的投资也从映射和跟随,变为引领。(周小白)

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  小说尾声,浑然不知李斐惨烈经历的庄树心存幻想,以为童年往事的回忆能把湖水变成平原。最后一句话陡然宕开现实,展开青春尽头的冷酷仙境:“北方午后的微风吹着她,向着岸边走去。”这则结尾,和《刺杀小说家》意趣相通,“信念”介入且暂时地战胜了现实。

  此外,重庆市税务部门通过加快出口退税办理进度、扩大出口退税申报“免填报”范围等方式,助推重庆高水平对外开放,2022年为外贸企业办理出口退(免)税227.5亿元。

  <strong>依托“一城一云”理念,华为云深耕城市数字化</strong>

  陶林超,平顶山市生态环境局鲁山分局环境监察大队一中队(张良中队)原工作人员,严重职务违法,被给予开除公职处分;犯环境监管失职罪,被司法机关判处有期徒刑八个月,缓刑一年。

  <strong>实践出真知,华为云携手多地政府共建城市云</strong>

  将帅同期被免职的情况在保险行业并不多见。公开资料显示,罗桂友自2015年6月担任富德产险董事、总经理,在富德产险任职已有7年。

蔡宜新

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有