摘要
本发明涉及语音处理技术领域,具体涉及基于语音识别的智能会议内容实时翻译方法,包括以下步骤:采集原始语音信号,采用突变噪声抑制算法生成增强语音流,同步提取声纹指纹图谱;将增强语音流输入层级化分离网络,基于声纹指纹图谱进行多发言人语音解耦,输出带身份标签的语音片段并触发增量式术语知识库更新;生成跨语种语义一致性向量,同时构建动态更新的上下文记忆池;将语义一致性向量转换为目标语言流。本发明,提升语音解耦的空间准确性与语义独立性,为后续语义建模与翻译提供结构化输入基础,特别适用于交叉发言、重叠语流频发的会议场景。
技术关键词
翻译方法
语音
语义
发言人
术语
噪声抑制算法
会议
图谱
指纹
掩码矩阵
分布式麦克风阵列
身份
记忆
分层存储架构
一维卷积神经网络
融合时空特征
标签
动态更新
节点间信息
系统为您推荐了相关专利信息
文本生成模型
语种识别
格式模板
文档生成方法
文本生成技术
语音特征
卷积神经网络模型
语音识别方法
矩阵
语义解析技术
文本
非易失性存储介质
对象
音频
神经网络模型训练