语音文本识别方法和装置、电子设备、存储介质

AITNT
正文
推荐专利
语音文本识别方法和装置、电子设备、存储介质
申请号:CN202411488718
申请日期:2024-10-23
公开号:CN119314485A
公开日期:2025-01-14
类型:发明专利
摘要
本申请实施例提出的语音文本识别方法和装置、电子设备、存储介质,涉及人工智能技术领域及金融科技领域。该方法包括:对目标语音数据进行声谱特征提取,得到目标声谱特征;通过目标声学语言模型的输入层对目标声谱特征进行特征向量嵌入,得到目标声谱嵌入向量;通过目标声学语言模型的隐藏层对目标声谱嵌入向量进行深层特征映射,得到目标声谱深层向量;通过目标声学语言模型的循环神经网络层对目标声谱深层向量进行上下文特征提取,得到目标声谱上下文向量;通过目标声学语言模型的输出层对目标声谱上下文向量进行发音特征映射,得到目标发音特征向量;对目标发音特征向量进行文本解码,得到目标文本。本申请实施例能够提高语音文本识别准确性。
技术关键词
声谱 发音特征 样本 文本识别方法 长短期记忆神经网络 语音 标签文本 特征提取模块 文本识别装置 电子设备 可读存储介质 人工智能技术 数据获取模块 解码模块 处理器
系统为您推荐了相关专利信息
1
一种基于自适应光谱块的时间序列数据异常检测方法
频域特征 滤波器 时域特征提取 卷积特征提取 编码
2
一种模型推理方法、装置、设备及介质
推理方法 序列 键值 样本 推理装置
3
物料的装载控制方法、装置、设备、介质和产品
运输设备 铲装设备 装载控制方法 实时位置 物料位置信息
4
一种对产品寿命进行抽检的方法、装置及存储介质
样本 粒子群优化算法 风险 概率密度函数 寿命
5
一种基于生物神经网络的全光智能计算控制方法及系统
障碍物 车辆 生物 神经网络模型 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号