从以分计价到以厘计价 大模型为何纷纷降价

来源: 中关村在线
2024-06-18 12:29:53

  ◎本报记者 吴叶凡 崔 爽

  近日,各大电商平台开启了年中购物促销活动。但令人们始料未及的是,许多国内的人工智能大模型厂商也掀起了一波“降价潮”。记者梳理发现,仅上个月,就有字节跳动、阿里、百度、腾讯等多家知名企业旗下的大模型降价。

  国家数据局局长刘烈宏在今年3月透露,中国10亿参数规模以上的大模型数量已超过100个。在业内人士看来,“百模大战”已然打响,国产大模型的降价,似乎是这场“战事”愈演愈烈的佐证。

  技术优化让成本降低

  记者梳理发现,较早发布降价信息大模型厂商的是深度求索(DeepSeek)。5月6日,其旗下的DeepSeek-V2 API(应用程序编程接口)定价下调至每百万tokens输入1元、输出2元。

  厂商所说的“tokens”,是大模型用来表示自然语言文本的单位,可以直观地理解为“字”或“词”。通义千问官网相关说明显示,对于中文文本,1token通常对应一个汉字或词语;对于英文文本,1token通常对应3至4个字母或1个单词。阿里云智能集团资深副总裁刘伟光形象地将通义千问旗下一款模型的降价幅度描述为:1块钱可以买200万tokens,相当于5本《新华字典》的文字量。

  目前,国内大模型厂商普遍根据输入和输出的token数量,分别进行计费。根据通义千问官网发布的解释,这是因为模型在推理过程中,输入和输出的资源消耗不同。输入计费是针对用户向模型提交的请求数据进行计费,包括用户提交给模型的文本、图像、音频等原始数据。输出计费则是针对模型返回给用户的输出结果进行计费,包括模型生成的文本、图像、音频等处理结果。

  从降价幅度看,此次大模型总体降价幅度较大,其中输入价格较输出价格降幅更大。例如,通义千问的主力模型Qwen-Long的API输入价格从0.02元/千tokens降至0.0005元/千tokens,降幅达97%;API输出价格从0.02元/千tokens降至0.002元/千tokens,降幅达90%。腾讯旗下的混元-standard模型的API输入价格从0.01元/千tokens降至0.0045元/千tokens,下降55%;API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%。

  大模型价格是如何被“打下来”的?火山引擎总裁谭待曾公开表示,降价是通过技术优化实现的,并非只是补贴、用亏损换收入。

  从技术上看,通过优化算法和模型训练过程来提升算力的使用效率,是大多数大模型厂商得以降低成本的原因之一。一些厂商也使用了分布式推理和混合调度等手段来提升整体算力资源利用效率。此外,在AI基础设施层面,一些大模型厂商同时也是大型云服务商,其在公共云方面的技术红利和规模效应,带来了成本优势。

  拓展市场成降价诱因

  在艾媒咨询CEO兼首席分析师张毅看来,大模型降价除了技术提升带来的红利,更多是基于商业逻辑、市场竞争等方面的考量。他坦言,虽然大模型未来发展依旧面临较多挑战,但对于大模型厂商而言,技术并不能构建起绝对的“门槛”。大模型“大厂”间的技术竞争会越来越白热化,差异也会越来越小。

  “因此厂商们选择在商业逻辑上展开竞争。” 张毅说,大模型用户可分为两类:一类是普通消费者,即个人用户端,也就是所谓的C端;一类是企业用户,即以商家为代表的B端。

  目前,对于大多数普通消费者来说,通过官网或手机应用来体验、使用大模型产品大多无需付费。张毅认为对C端的免费将是必然趋势。对于B端用户,厂商则为他们提供封闭式大模型解决方案,供其开发垂直或行业型应用。此次大模型降价,正是为拓展潜在的B端用户,这也是大模型主流的商业路径。

  “无论是面向C端还是B端,因为无法在技术上具有绝对的领先优势,大家拼的就是时间。这意味着厂商的融资能力会决定一切,而融资能力又是由用户规模决定的。”在张毅眼中,这类似20年前搜索引擎的商业模式。大模型厂商需要依靠免费、低价来吸引用户,扩大用户规模,进而获得融资,在大浪淘沙后生存下去。

  追求价廉还需兼顾物美

  人工智能作为一项战略性新兴技术,日益成为科技创新、产业升级和生产力提升的重要驱动力量。目前,大部分企业对于应用AI来提升生产效率都有需求。但想要在应用场景中真正使大模型落地,降低落地应用成本和试错成本是关键。

  此次降价,对于各个领域的企业来说,都是推动人工智能在业务场景中应用的机遇。正如谭待所说:“大模型从以分计价到以厘计价,将助力企业以更低成本加速业务创新。” 创新工场董事长兼零一万物CEO李开复也预测,在明年下半年,人们将迎来大模型普惠应用的井喷期。

  乐观声音出现的同时,也有一些人认为,降价可能带来一些潜在的问题,比如服务质量下降、技术研发投入减少、市场恶性竞争等。事实上,此次降价的大模型企业,大多为实力雄厚的“大厂”。大部分创业公司都没有“跟风”降价,比如李开复就曾公开表示:“我们绝对不会跟这样的一个定价来做对标。”对于大模型创业公司,如果以往的价格优势不复存在,就意味着其B端业务可能受到影响。“这次大降价基本宣告了大模型创业公司必须寻找新的商业模式。” 猎豹移动董事长兼CEO傅盛在个人社交媒体上表示。

  中国社科院亚太与全球战略研究院研究员张洁6日接受《环球时报》记者采访时表示,这次中国—东盟(10+1)领导人会议,实际上是把全球发展倡议、全球安全倡议和全球文明倡议“三大全球倡议”优先落实到中国与东盟的合作当中。李强总理提出的“四个携手”的建议十分具体,具有前瞻性和可行性:比如加强新能源汽车、光伏、人工智能等领域合作,与“全球发展倡议”中有关新兴产业合作一致;积极推进“南海行为准则”案文磋商,开展打击电信网络诈骗等合作则是关系到区域内各国安全和民众生活的焦点问题。可以预见,这些建议和会议签署的文件将推动中国与东盟合作的指南,引领双方关系继续走实走深。

  9月7日,长春发布消息,在第39个教师节即将到来之际,吉林省委常委、长春市委书记张恩惠来到市第一〇八学校、市十一高中看望慰问一线教师,代表市委、市政府向全市教师和广大教育工作者致以节日问候和崇高敬意,勉励大家在“三尺讲台”坚守初心,落实立德树人根本任务,努力培养更多德智体美劳全面发展的社会主义建设者和接班人,为长春实现全面振兴新突破贡献教育力量。

  王洋:与2009年足坛反腐相比,这一轮足坛反腐风暴有以下三个突出特点:第一,涉案官员级别更高;第二,负责查办案件的机构或者说线路更多;第三,涉案金额更大。

  9月4日,规划建设保障性住房工作部署电视电话会议在京召开,会议明确了我国规划建设保障性住房所面临的问题和今后的工作方向。其中提出,保障性住房要实施严格封闭管理,不得上市交易。很快,不少房产自媒体将这一表述解读为“现有经适房、限价房、共有产权房等保障性住房不能上市交易”,并进行传播。这使得不少已购买经适房等保障房的家庭担心将来无法交易,开始扎堆办理“经转商”(经济适用房转为商品房)手续。

  王洋:与2009年足坛反腐相比,这一轮足坛反腐风暴有以下三个突出特点:第一,涉案官员级别更高;第二,负责查办案件的机构或者说线路更多;第三,涉案金额更大。

  8月21日,国家安全部官方微信发布消息,近日,国家安全机关破获一起美国中央情报局间谍案。犯罪嫌疑人郝某系我某国家部委干部,在日留学期间被策反。

曹智仁

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有