4虎永久中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源

2024-06-19 13:41:38　来源：4虎永久

　　每经记者杨卉每经编辑魏官红

　　《每日经济新闻》记者了解到，针对大模型训练算力消耗高的问题，TeleAI与智源基于模型生长和损失预测等关键技术联合研发出的Tele-FLM系列模型，仅使用了业界普通训练方案9%的算力资源，基于112台A800服务器，用时4个月完成了3个模型总计2.3T tokens的训练。

　　中国电信方面透露，Tele-FLM-1T版本即将开源，期望为社区训练万亿稠密模型提供技术参考，避免万亿模型训练收敛难等问题。

　　据悉，作为最早布局并首先开源大模型的央企机构，TeleAI去年发布了千亿参数“星辰”语义大模型；今年2月，TeleAI自主研发的星辰大模型首次通过了“境内深度合成服务算法备案”。今年5月15日，根据北京市生成式人工智能服务备案信息公告，星辰大模型再次通过产品备案。“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

　　开源方面，TeleAI已接连开源7B、12B、52B参数规模大模型。随着TeleChat系列模型的发布，TeleAI还同步对多个大模型落地项目进行了能力升级，如在某市民生诉求场景项目上，通过引入TeleChat-52B模型能力，整体应用效果提升40%。

【编辑:张育菁】

更多精彩内容请进入文化频道

文化新闻精选：

劳动课写入新学期课表！教什么？在哪上？

2024-06-19 13:41:38
假燕窝事件再起波澜！辛巴爆料刘畊宏哭了后道歉

2024-06-19 13:41:38
北京地铁一男子向女乘客小便被刑拘

2024-06-19 13:41:38
开放还是封闭？中美给出了不同答案

2024-06-19 13:41:38
普京一个动作，吓坏北约“优等生”

2024-06-19 13:41:38
云南新增确诊病例5例，均为境外输入

2024-06-19 13:41:38
31省区市新增本土“307+1596”

2024-06-19 13:41:38
白宫发言人：“MAGA共和党人”就是极端分子

2024-06-19 13:41:38
北京通州新增1例感染者！涉及风险点位公布

2024-06-19 13:41:38
美方限制高性能半导体出口，哪些领域会受到影响？

2024-06-19 13:41:38

变天操逼	黄色软件app3.0.3免费oppo版大全2022
俄罗斯熟女	快手版快猫app

27报887期q友	红猫大本猫营hm312金太阳
gogo大胆	锕锕锕锕锕锕～好深啊jk漫画

4虎永久中国电信发布单体稠密万亿参数语义模型 用了普通训练方案9%的算力资源

4虎永久中国电信发布单体稠密万亿参数语义模型 用了普通训练方案9%的算力资源

相关新闻：

文化新闻精选：

4虎永久中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源

4虎永久中国电信发布单体稠密万亿参数语义模型用了普通训练方案9%的算力资源