摘要
本发明提供了一种基于边缘算力的多语种语音识别方法及系统,通过获取待识别语音信号,提取声学特征;随后通过语言注意力模块计算语音信号的语言向量,根据语言向量动态激活若干专家模块,并计算各专家模块的融合权重;将声学特征输入激活的专家模块中,生成混合输出;对混合输出进行解码,生成识别文本,具体的,通过语言注意力模块和动态专家模块选择的设计,可以实时适应混合语场景,降低语言间干扰,同时,减少模型参数量,降低边缘端推理延迟。
技术关键词
多语种语音
声学特征
识别语音信号
识别方法
模块
注意力
估计噪声功率
文本
CTC算法
解码
可读存储介质
频谱特征
云端服务器
序列
动态
电子设备
识别系统
存储器
处理器
系统为您推荐了相关专利信息
配电网开关状态
配电自动化开关
多源信息融合
分段
分析方法
自动筛选系统
购物中心
分析模块
购物习惯
会员管理系统
信息数据管理系统
画像
客户
数据项
企业经营数据