摘要
本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开一种语音处理方法、装置、计算机设备及存储介质,方法包括:获取输入的语音特征序列,对所述语音特征序列进行划分,以得到多个相邻的特征块;对各个所述特征块进行上下文建模,以提取各个特征块内的上下文信息;基于跨块注意力机制,建立相邻的特征块之间的连接关系;对各个所述特征块的上下文信息进行编码,基于预设的聚类模型对编码后的上下文信息进行分组,以生成离散化的语音结果;基于预设的大语音模型、所述离散化的语音结果以及相邻的特征块之间的连接关系,生成输出语音。本发明解决了现有技术中无法适应动态实时信息的技术问题。
技术关键词
语音特征
计算机可读指令
注意力机制
序列
关系
生成语音
计算机设备
可读存储介质
人工智能技术
医疗健康
实时信息
业务系统
编码模块
处理器
元素
输出模块
存储器
系统为您推荐了相关专利信息
有限元模拟方法
冷轧辊
组织
应力
热处理工艺参数
融合时序信息
卡尔曼滤波器
匈牙利算法
信号
轨迹
自动更新方法
图谱
自动更新系统
版本控制技术
电力
时间序列图像
标靶
变形监测系统
校正
变形监测方法
电力线巡检机器人
动态
因子
历史监测数据
实时监测数据