摘要
本发明提供了一种智能语义理解及校准的生成式语音识别方法以及系统,包括:对通话过程中的语音数据进行特征提取,得到关键语音特征;将关键语音特征输入到基于长短期记忆网络的深度学习模型进行语义理解,得到初步语义结果;获取所述通话过程的通话场景,在所述通话场景关联的数据库中,分析所述初步语义结果关联的多维度语义,得到语义关联矩阵;根据所述语义关联矩阵对所述初步语义结果进行自适应校准,得到校准语义结果;基于生成对抗网络,对所述校准语义结果进行文本生成处理,得到语音识别文本结果。在本发明中,使得最终生成的文本结果更加准确、完整。
技术关键词
智能语义理解
语音识别文本
语音识别方法
校准
生成对抗网络
语音特征
长短期记忆网络
深度学习模型
场景
生成通讯密钥
生成文本内容
识别语音数据
关键词
语音识别系统
特征提取单元
文件夹
系统为您推荐了相关专利信息
结构光编码图案
可编程逻辑单元
结构光3D相机
投影模块
序列
三维扫描数据
激光扫描装置
人机
驾驶室
计算机可执行指令
闪电搜索算法
电池剩余使用寿命
历史运行数据
概率密度函数
燃料电池
振动信号采集电路
绞车传感器
信号变换模块
绞车滚筒
时钟管理单元
边缘计算方法
光场相机
数据
高频特征
子孔径图像