中国电信发布单体稠密万亿参数语义模型 用了普通训练方案9%的算力资源

来源: 南方周末
2024-06-19 13:52:59

  每经记者 杨卉    每经编辑 魏官红    

  《每日经济新闻》记者了解到,针对大模型训练算力消耗高的问题,TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系列模型,仅使用了业界普通训练方案9%的算力资源,基于112台A800服务器,用时4个月完成了3个模型总计2.3T tokens的训练。

  中国电信方面透露,Tele-FLM-1T版本即将开源,期望为社区训练万亿稠密模型提供技术参考,避免万亿模型训练收敛难等问题。

  据悉,作为最早布局并首先开源大模型的央企机构,TeleAI去年发布了千亿参数“星辰”语义大模型;今年2月,TeleAI自主研发的星辰大模型首次通过了“境内深度合成服务算法备案”。今年5月15日,根据北京市生成式人工智能服务备案信息公告,星辰大模型再次通过产品备案。“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

  开源方面,TeleAI已接连开源7B、12B、52B参数规模大模型。随着TeleChat系列模型的发布,TeleAI还同步对多个大模型落地项目进行了能力 升级,如在某市民生诉求场景项目上,通过引入TeleChat-52B模型能力,整体应用效果提升40%。

  北京第二外国语学院中国文化和旅游产业研究院副教授吴丽云认为,近年来,三亚的淡旺季逐渐在淡化,以往暑期是三亚的淡季,但是在近两年的暑期,三亚酒店的入住率还是比较高的。

  中央经济工作会议在部署做好2023年经济工作时,强调“着力扩大国内需求”“要把恢复和扩大消费摆在优先位置”。日前召开的国务院常务会议作出一系列部署,要求推动消费加快恢复和保持外贸外资稳定,增强对经济的拉动力。

<img src="//i2.chinanews.com/simg/hnhd/2023/02/01/70/11017228289752530558.jpg" alt="" />

  在公司股价大跌背后,佳沃食品2022年业绩预告显示,2022年公司实现的归属净利润预计亏损10亿-16亿元,系上市后业绩最差的一年。实际上,亏出新高的佳沃食品归属净利润已在2019-2021年间连续亏损。财务数据显示,2019-2021年,佳沃食品实现的营业收入分别约为34.28亿元、45.25亿元、45.97亿元;对应实现的归属净利润分别约为-1.26亿元、-7.13亿元、-2.89亿元。

  当地时间1月31日,黎巴嫩央行行长里亚德·萨拉马宣布,黎巴嫩将从2月1日起采用新的固定汇率,黎巴嫩镑对美元官方固定汇率将从1507.5:1调整为15000:1。采用新汇率后,黎镑将贬值90%,但新官方固定汇率与黎镑对美元黑市汇率仍有较大差距。1月31日,黎镑对美元黑市汇率约为57000:1。

  在运营方面,上述工作人员指出,将通过国外、国内两个市场予以实现。国外市场方面,公司将全力推动智利管理团队采取措施,实现降本增效,克服包括饲料成本上涨等宏观产业环境的不利因素。在国内市场方面,公司将进一步开拓国内市场,在中国市场以轻资产运营为核心,深度布局高附加值产品,最终实现“全球资源+中国消费”的发展战略,并迎来中国业务的快速增长。

傅岳琳

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有