摘要
本发明公开了一种基于人工智能的语音纠错方法及系统,涉及语音交互技术领域,该方法包括:获取当前时间节点输入的语音输入信息,输出对应的拼音序列;将拼音序列导入预设的字词数据库中,遍历与拼音序列对应的多个汉字序列,多个汉字序列为同音字词;采用基于注意力机制的上下文校验模型对多个汉字序列与拼音序列的语义契合度分别进行评分,输出每个汉字序列的语义评分值;将语义评分值最高的汉字序列确定为目标汉字序列,得到与语音输入信息对应的目标汉字文本。本发明通过基于注意力机制的上下文校验模型进行评分而确定目标汉字文本,解决了现有技术中语音转换文字时因为多音字问题导致语音纠错过程不够准确,语音转换结果准确性低的问题。
技术关键词
语音输入信息
汉字
语音纠错方法
校验模型
序列
拼音
语义
语音纠错系统
字词
语音交互技术
多头注意力机制
文本
输出模块
深度学习模型
处理器
端点
节点
系统为您推荐了相关专利信息
反演方法
深度学习神经网络
图像
轨迹特征
滑动窗口机制
异常检测方法
经验模态分解算法
输出开关柜
信号
计算机程序产品
脓肿分枝杆菌
基因
双组分系统
试剂盒
质谱检测法
无人机群协同
主节点
高精度定位模块
因子
定位方法