一种语音处理方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510540095

申请日期：2025-04-27

公开号：CN120412554A

公开日期：2025-08-01

类型：发明专利

摘要

本发明涉及人工智能技术领域，可应用于金融科技、医疗健康等业务系统平台中，公开一种语音处理方法、装置、计算机设备及存储介质，方法包括：获取输入的语音特征序列，对所述语音特征序列进行划分，以得到多个相邻的特征块；对各个所述特征块进行上下文建模，以提取各个特征块内的上下文信息；基于跨块注意力机制，建立相邻的特征块之间的连接关系；对各个所述特征块的上下文信息进行编码，基于预设的聚类模型对编码后的上下文信息进行分组，以生成离散化的语音结果；基于预设的大语音模型、所述离散化的语音结果以及相邻的特征块之间的连接关系，生成输出语音。本发明解决了现有技术中无法适应动态实时信息的技术问题。

技术关键词

语音特征计算机可读指令注意力机制序列关系生成语音计算机设备可读存储介质人工智能技术医疗健康实时信息业务系统编码模块处理器元素输出模块存储器

系统为您推荐了相关专利信息

针对冷轧辊预备热处理的有限元模拟方法

有限元模拟方法冷轧辊组织应力热处理工艺参数

一种融合时序信息的车路协同3D目标检测方法

融合时序信息卡尔曼滤波器匈牙利算法信号轨迹

语义驱动的电力图谱节点自动更新方法

自动更新方法图谱自动更新系统版本控制技术电力

基于相位信息的变形监测系统及方法

时间序列图像标靶变形监测系统校正变形监测方法

一种基于动态事件触发的电力线巡检机器人的控制方法

电力线巡检机器人动态因子历史监测数据实时监测数据

一种语音处理方法、装置、计算机设备及存储介质

站点导航

APP 下载