一种终端设备及语音应答方法

正文

推荐专利

一种终端设备及语音应答方法

申请号：CN202411049364

申请日期：2024-07-31

公开号：CN118782037A

公开日期：2024-10-15

类型：发明专利

摘要

本申请一些实施例提供一种终端设备及语音应答方法，所述方法可以响应于语音交互指令，获取语音交互指令对应的源音频数据。再根据源音频数据的音频单元生成特征向量，并基于音频嵌入算法计算特征向量的语音向量。拼接特征向量和语义向量，以生成第一融合向量。再根据第一融合向量预测第二融合向量，并按照第二融合向量生成应答音频数据，以及控制音频输出装置播放应答音频数据。其中，应答音频数据基于端到端音频输出模型生成，端到端音频输出模型的输入为第二融合向量。所述方法通过端到端的音频输入及输出，根据源音频数据中多维度特征生成相应的应答音频数据，可减少源音频数据的信息丢失，提高应答音频数据中音频特征的可靠性。

技术关键词

特征提取模型音频编码语音应答方法生成特征向量语义向量序列终端设备音频单元数据基准频谱特征控制音频输出装置注意力机制控制器执行傅里叶变换标记切片

系统为您推荐了相关专利信息

基于动作连贯性的视频生成方法、装置、设备及介质

视频生成方法视频帧关键帧噪声运动感知模块

一种基于边端设备视频数据的生产设备故障识别预警方法及系统

识别预警方法压缩特征向量存储结构支持向量机算法场景

基于大模型微调的业务规划智能分解方法、设备及介质

规划逻辑分析基线图谱场景化数据

音效生成方法、装置、电子设备

音效生成方法自然语言文本语义向量音频频谱特征

生物时序信号的波形形态特征提取方法、设备及介质

形态学特征时序特征提取方法特征提取模型生物

一种终端设备及语音应答方法

站点导航

APP 下载