一种终端设备及语音应答方法

AITNT
正文
推荐专利
一种终端设备及语音应答方法
申请号:CN202411049364
申请日期:2024-07-31
公开号:CN118782037A
公开日期:2024-10-15
类型:发明专利
摘要
本申请一些实施例提供一种终端设备及语音应答方法,所述方法可以响应于语音交互指令,获取语音交互指令对应的源音频数据。再根据源音频数据的音频单元生成特征向量,并基于音频嵌入算法计算特征向量的语音向量。拼接特征向量和语义向量,以生成第一融合向量。再根据第一融合向量预测第二融合向量,并按照第二融合向量生成应答音频数据,以及控制音频输出装置播放应答音频数据。其中,应答音频数据基于端到端音频输出模型生成,端到端音频输出模型的输入为第二融合向量。所述方法通过端到端的音频输入及输出,根据源音频数据中多维度特征生成相应的应答音频数据,可减少源音频数据的信息丢失,提高应答音频数据中音频特征的可靠性。
技术关键词
特征提取模型 音频编码 语音应答方法 生成特征向量 语义向量 序列 终端设备 音频单元 数据 基准 频谱特征 控制音频输出装置 注意力机制 控制器 执行傅里叶变换 标记 切片
系统为您推荐了相关专利信息
1
基于动作连贯性的视频生成方法、装置、设备及介质
视频生成方法 视频帧 关键帧 噪声 运动感知模块
2
一种基于边端设备视频数据的生产设备故障识别预警方法及系统
识别预警方法 压缩特征向量 存储结构 支持向量机算法 场景
3
基于大模型微调的业务规划智能分解方法、设备及介质
规划 逻辑分析 基线 图谱 场景化数据
4
音效生成方法、装置、电子设备
音效生成方法 自然语言文本 语义向量 音频 频谱特征
5
生物时序信号的波形形态特征提取方法、设备及介质
形态学特征 时序 特征提取方法 特征提取模型 生物
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号