消费 > 正文

业内首个非自回归端到端语音识别模型

2022-12-22 15:06:15    来源:IT之家    阅读量:6258   

阿里巴巴达摩院今日发布新一代语音识别模型Paraformer,适用于语音输入法,智能客服,车载导航,会议纪要等场景。

据介绍,这是业内首个非自回归端到端语音识别模型其推理效率最高可达传统模型的10倍,识别准确率在众多权威数据集排名第一目前该模型在魔术社区面向全社会开源

资料显示,用GPU推理,不同版本的Paraformer可以提高推理效率5—10倍同时,Paraformer采用6倍下采样的低帧率建模方案,可以减少近6倍的计算量,支持大模型的高效推理

本站了解到,阿里达摩院表示,Paraformer是阿里巴巴研发的下一代杀手级语音识别基础模型,未来将广泛应用于理解,钉钉语音转文本,高德导航等会议纪要产品中。

相关阅读:

阿里达摩院推出AI模型社区魔:开源300+ AI模型,可体验国画AI

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

相关阅读

慢新闻

新家入住换新机!京天华盛春季家装节大促进行中 新家入住换新机!京天华盛春季家装节大促进行中

娱乐

新闻推荐

网站地图

先驱网--综合性的生活资讯平台

  邮箱:hchchc0324@163.com