摘要
本发明公开了一种多模态动态残差中文文本拼写纠错方法及系统,该方法包括:S100:对句子进行错误定位和掩码处理,得到错误汉字、错误汉字的嵌入特征和句子的掩码向量,以及将句子的原始嵌入特征作为初始残差嵌入矩阵;S200:提取错误汉字的音频特征和字形特征并进行基于注意力机制的融合,得到错误汉字的多模态表征特征,利用多模态表征特征替换初始残差嵌入矩阵中错误汉字的残差嵌入特征;S300:使用句子的掩码向量进行编码,编码结果结合当前的残差嵌入特征进行分类,并输出纠正后的句子。本申请使用错误汉字的多模态信息修正传统残差结构,通过增强模型对错误汉字的干预,来降低模型被错误信息误导的风险,从而提高纠错精度。
技术关键词
字形特征
音频特征
拼写纠错方法
嵌入特征
子模块
中文文本
汉字
音频编码
注意力机制
多模态
动态
纠错系统
矩阵
错误检测模块
残差模块
残差归一化
双线性
系统为您推荐了相关专利信息
备份
子模块
深度包检测技术
数据采集模块
数据传输监测
故障诊断方法
注意力机制
机械振动信号
滑窗预处理
并行处理单元
子模块
自动化控制模块
资产管理技术
设备管理模块
能源
预训练语言模型
插件管理方法
列表
插件信息
指令
情感语音转换方法
频谱特征
声学特征
韵律特征
连续小波变换分析