摘要
一种基于双AC自动机的规范用语语音识别系统与方法,包括麦克风模块采集设备的声音,并将声音数据发送给语音识别模块,语音识别模块根据声音数据生成语音识别文本序列,并发给词元提取AC自动机,词元提取AC自动机根据语音识别文本序列和词元清单生成词元编号序列,并发给规范用语AC自动机,规范用语AC自动机根据词元编号序列和规范用语清单生成规范用语序列,并发给合规检测模块,合规检测模块通过合规清单对规范用语序列进行检测,其中规范用语分解模块为各模块提供根据规范用语的生成的对应清单,本发明通过通过采用双AC自动机,分别对词元与规范用语分别进行实现检测加速,同时增强方法鲁棒性,避免语气词等无效词,实现相近词的归一检测。
技术关键词
AC自动机
语音识别文本
语音识别模块
语音识别方法
序列
麦克风模块
生成语音
语音识别系统
字典树
语音特征提取
采集设备
结点
指针
平衡二叉树
节点
数据