摘要
本发明公开了一种智能语音转写方法、系统、设备及存储介质,该方法包括:采集语音数据,并对语音数据进行人声分离,获得不同用户对应的语音片段;确定语音片段对应的待处理文本序列,并通过线性预测分析确定语音片段的声学特征信息;对待处理文本序列进行特征提取,基于特征提取结果对待处理文本序列进行修正处理,获得处理后的文本序列;根据处理后的文本序列和声学特征信息确定与语音片段对应的包括标点符号信息的目标文本序列。由于本发明通过分离语音数据,并将语音片段转成文字,然后对待处理文本序列进行修正处理,最后确定与语音片段对应的包括标点符号信息的目标文本序列,相比于现有技术,本发明有效提高了语音转写的准确度。
技术关键词
智能语音转写方法
文本
声学特征
序列
编码器特征
声纹特征
场景意图
语义特征
人声
聚类
声纹识别模型
线性
特征提取模型
语音识别模块
数据采集模块
意图识别
程序
系统为您推荐了相关专利信息
高压线塔
稳定检测方法
滑坡位移监测
深度学习模型
监测点
医疗影像数据
时间序列预测模型
救援现场
物联网技术对数据
集成式传感器阵列
区间预测方法
LSTM算法
预测误差
计算机可读程序
分解算法
搜索算法
网络拓扑结构
设备配置
节点
网络拓扑数据