奇富科技智能语音模型川渝方言识别准确率提升超35%

来源: 南方周末
2024-05-31 15:46:53

5月31日消息,奇富科技智能营销及贷后提醒业务场景中,每天都能接到大量带方言口音的电话,客户口音的多样性直接影响到语音识别的准确率和业务的流畅度。为此,奇富科技宣布“QI语精灵”方言识别技术再度升级,成功将业内首个全自研Qifusion框架集成到业务场景中,不仅弥合方言识别对自身业务的影响,而且在业内知名的Kespeech 开源方言数据集性能对比测试中,字错率刷新模型最低值,达到国内顶尖水平。

据悉,QI语精灵是奇富科技全自研智能语音模型,此次升级依托自身丰富的贷后提醒及方言数据样本,不仅延续了对国内八种主流地区方言的覆盖,包括东北官话、胶辽官话、北京官话、冀鲁官话、中原官话、江淮官话、兰银官话和西南官话,还特别针对四川、重庆、山东、河南、贵州等用户分布较多的地区方言的识别能力进行了强化,平均识别准确率相对提升了25%,川渝地区方言识别准确率相对提升超35%。同时,融合方言信息提取模块,它能够自动识别不同口音,并在时间维度上对文字进行解码修正,将方言口音的语音识别误差率降低了30%以上,整体语音识别字错率降低了16%以上,显著提升了用户体验。

在模型结构上,QI语精灵依托全自研的Qifusion结构,突破传统方言识别模型受限于地区先验条件,需预先知晓方言种类才能准确识别的局限,无需方言种类的先验条件,便能直接进行精准的识别和转译。并创新采用了多任务学习方法,在复杂的通话环境下实现了超过93%的语音识别综合准确率。此外,意图识别功能同样表现出色,准确率超过95%,能够迅速而准确地识别用户需求并做出响应。

在业务应用上,基于QI语精灵提出的预训练方言信息模块及增量业务数据训练策略的结合,能大幅提升智能营销、贷后提醒、风险控制业务应用场景识别准确率。在智能电销及贷后客户沟通服务中,QI语精灵能将大量的语音转写成文字,无论是标准的普通话还是方言口音都能精准捕捉并转写,大幅减轻客服人员的工作压力。同时,能快速且准确地解析用户需求并作出响应,为用户提供精准高效的服务体验。

据介绍QI语精灵技术在实际应用中展现出的显著成效得益于奇富科技在人工智能语音领域的持续研究与开发积累。《Eden-TTS:一种简单高效的非自回归“端到端可微分”神经网络的语音合成架构》、《基于多粒度Transformer的多模态情绪识别》和《基于SE模块和多尺度特 征学习的语音情感识别》等多篇论文被ICASSP和 INTERSPEECH两大顶级语音领域的国际学术会议连续收录。

  <a target='_blank' href='/' >中新网</a>北京1月20日电(记者 袁秀月)近日,由中央网信办主办的2022中国正能量“五个一百”网络精品征集评选展播活动进入作品报送阶段,活动面向全网评出2021年8月1日至2022年12月31日期间原创发布的网络正能量内容。活动一启动,便引起网友的广泛关注和积极参与。

  “又到年根了,想给总书记念叨念叨我家的新账本,让总书记尝尝我家的‘开口笑’。”说起见到总书记的情景,徐海成还很激动。

  康义介绍,去年年底,国家发展改革委印发了扩消费、扩内需的中长期规划的方案,对扩大国内市场、促进消费、扩大就业、提高收入、改善收入分配、完善收入分配格局、提供便利化消费场景,把扩大内需和深化供给侧结构性改革相结合作出一系列安排。这些促消费政策的实施,将不断提高居民的消费能力,消费市场和消费规模都将稳步恢复和提升。

  <strong>生态环境保护的措施之实、力度之大、成效之显著前所未有</strong>

  巴黎的示威游行自下午2时从共和国广场开始,两个多小时后游行队伍尚未走完规划行程的一半,仍有大批民众在共和国广场等待出发,由此可见参与人数众多。晚上7时左右游行队伍中的大部分人才抵达终点民族广场。巴黎的示威游行大体平和,大批警察在现场严密戒备。

  “总的来说,预计2023年社会消费品零售总额的自然同比增速会逐步走高,然后趋于平稳,累计同比增速在6.1%左右。”苏剑称。(完)

陈明信

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
用户反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有