一种端侧语音交互方法及装置

正文

推荐专利

一种端侧语音交互方法及装置

申请号：CN202511244567

申请日期：2025-09-02

公开号：CN120977295A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及一种端侧语音交互方法，属于语音交互技术领域，该方法包括：在端侧设备上，利用压缩感知技术在语音采集端进行亚采样重构语音信号；将重构得到的语音信号输入脉冲神经网络模块提取情绪相关脉冲特征；将情绪相关脉冲特征输入轻量分类网络进行分类；自动语音识别模型将重构得到的语音信号转写为文本内容，文本内容作为自然语言处理大模型的输入，利用预训练语言模型或接入大模型平台进行语义解析与分类后的情绪交叉建模输出语义情绪标签；采用FastSpeech2‑Lite与HiFi‑GAN Mini的联合方法，将语义情绪标签与文本内容转化为具有相应情感的语音输出。本发明实现离线、低功耗的情感语音识别与合成。

技术关键词

语音交互方法脉冲特征重构语音信号预训练语言模型压缩感知技术自动语音识别分类网络稀疏系数向量语义文本自然语言 Softmax函数标签语音交互技术语音交互装置云端输出模块

系统为您推荐了相关专利信息

一种配电设备状态监测方法、监测系统及程序产品

配电设备状态脉冲特征监测点监测方法模拟模型

一种基于知识图谱的专业人员影响力评价与动态推演方法、系统及存储介质

推演方法预训练语言模型专业层级变量

一种基于自然语言处理的工单特征分类方法及系统

特征分类方法自然语言标识计算机执行指令语法结构

面向知识图谱问答的SPARQL生成优化方法及系统

面向知识图谱 SPARQL查询答案预训练语言模型深度优先搜索

一种自进化语义分类与动态知识库构建系统

构建系统语义预训练语言模型子模块可视化界面

一种端侧语音交互方法及装置

站点导航

APP 下载