阿里云官宣:通义千问GPT-4级主力模型价格直降97%

来源: 央广网
2024-05-22 08:40:47

​5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。

5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400,击穿全球底价。

Qwen-Long是通义千问的长文本增强版模型,性能对标GPT-4,上下文长度最高达1千万。除了输入价格降至0.0005元/千tokens,Qwen-Long输出价格也直降90%至0.002元/千tokens。相比之下,国内外厂商GPT-4、Gemini1.5 Pro、Claude 3 Sonnet及Ernie-4.0每千tokens输入价格分别为0.22元、0.025元、0.022元及0.12元,均远高于Qwen-long。

通义千问本次降价共覆盖9款商业化及开源系列模型。不久前发布的通义千问旗舰款大模型Qwen-Max,API输入价格 降至0.04元/千tokens,降幅达67%。Qwen-Max是目前业界表现最好的中文大模型,在权威基准OpenCompass上性能追平GPT-4-Turbo,并在大模型竞技场Chatbot Arena中跻身全球前15

不久前,OpenAI的Sam Altman转发了Chatbot Arena榜单来印证GPT-4o的能力,其中全球排名前20的模型中,仅有的三款中国模型都是通义千问出品。

业界普遍认为,随着大模型性能逐渐提升,AI应用创新正进入密集探索期,但推理成本过高依然是制约大模型规模化应用的关键因素。

在武汉AI智领者峰会现场,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光表示:“作为中国第一大云计算公司,阿里云这次大幅降低大模型推理价格,就是希望加速AI应用的爆发。我们预计未来大模型API的调用量会有成千上万倍的增长。”

刘伟光认为,不管是开源模型还是商业化模型,公共云+API将成为企业使用大模型的主流方式,主要有三点原因:

一是公共云的技术红利和规模效应,带来巨大的成本和性能优势。阿里云可以从模型自身和AI基础设施两个层面不断优化,追求极致的推理成本和性能。阿里云基于自研的异构芯片互联、高性能网络HPN7.0、高性能存储CPFS、人工智能平台PAI等核心技术和产品,构建了极致弹性的AI算力调度系统,结合百炼分布式推理加速引擎,大幅压缩了模型推理成本,并加快模型推理速度。

即便是同样的开源模型,在公共云上的调用价格也远远低于私有化部署。以使用Qwen-72B开源模型、每月1亿tokens用量为例,在阿里云百炼上直接调用API每月仅需600元,私有化部署的成本平均每月超1万元。

二是云上更方便进行多模型调用,并提供企业级的数据安全保障。阿里云可以为每个企业提供专属VPC环境,做到计算隔离、存储隔离、网络隔离、数据加密,充分保障数据安全。目前,阿里云已主导或深度参与10多项大模型安全相关国际国内技术标准的制定。

三是云厂商天然的开放性,能为开发者提供最丰富的模型和工具链。阿里云百炼平台上汇聚通义、百川、ChatGLM、Llama系列等上百款国内外优质模型,内置大模型定制与应用开发工具链,开发者可以便捷地测试比较不同模型,开发专属大模型,并轻松搭建RAG等应用。从选模型、调模型、搭应用到对外服务,一站式搞定。

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

  到达广州后的第二天一大早,申军良就带着钟丁酉去了广州中院申请会见张维平、周容平。“因为民事赔偿还没有完全执行,最重要的是梅姨还没落网,至少还有3个孩子没找到,他们可能是最后的线索。他们被执行死刑之后,梅姨这个人可能就真的消失了,我们想在最后的时间里争取一下。”

  对美光公司实施网络安全审查是中国首次针对一家美国半导体公司采取行动。此前,不少外媒在报道时认为,中国对美国芯片制造商美光进行审查,主要是为了对美国遏制中国半导体技术发展进行回应。然而,网络安全审查,这是中国网信办拥有的一项日常工作权限。外交部发言人也回应表示,中国有关部门依法依规对影响或者可能影响国家安全的网络产品进行网络安全审查,是一种正常的监管措施。对于所有的企业来说,不管是中国企业还是美国企业,还是其他国家的企业,在中国经营首先要做到的是遵守中国的法律法规,只要能够守法合法经营,就没有什么可担心的。

  悉尼洛威研究所国际安全计划主任萨姆·罗格芬表示,任何向远程打击能力迈进的举动都会破坏地区关系的稳定,特别是与邻国和地区伙伴印度尼西亚的关系,并进一步与中国对抗。

  在加州拉斯维加斯的展会现场,她参观了一周,成千上万的摊位几乎跑遍了,却没找到中国的摊位。好不容易在拥挤的人群中看到了几个国人手中拿着长城公司的塑料袋,她立马迎上去,亲切地问:“你们是来参展的吧?” “不,是来参观的。”

  虽然多次串供,并努力销毁证据,但闫学会深知,她的所作所为严重违反了党纪国法,一旦暴露将面临纪法严惩。为了消除内心的担忧和恐慌,她开始多次联系此前经人介绍认识,声称可以算命并能作法替人消除灾祸、人称“黄姨”的神秘女子,向其咨询官运前途,拜大神、求大仙,希望得到神灵护佑,去除升迁阻碍、免除“牢狱之灾”。

  “现在来看,2020年实现学术产出总量并行的目标已经实现了,但当时还有一个期望,即投入到基础研究的资源可以与欧美大体相当,后来这点没能完全实现。2030年实现贡献并行目标预计会有一定的难度,当初预测时对全球科研合作的预测显得过于乐观,对2050年实现源头并行目标也还要再观察才能判断。”杨卫说。

周志杰

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有