摘要
本发明涉及人工智能领域,尤其是涉及基于拼音增强的检测纠正双阶段中文拼写纠错方法、系统;该方法通过将中文拼写纠错任务分解为错误检测与纠正两个子任务:检测网络用于预测文本中不同位置的字符错误概率;纠正网络则通过改进BERT的结构以增强对包含拼写错误句子的理解能力,通过在嵌入层引入拼音特征,并联合训练拼音增强的掩码语言模型,从而有效捕捉语音相似性特征,显著提升文本检测纠错精度。
技术关键词
错误检测
字符
拼写纠错方法
拼音
多模态特征
序列
掩码策略
网络
模型预训练
中文文本纠错
输入错误
阶段
纠错系统
数据
解码器
编码器
注意力机制
汉字
系统为您推荐了相关专利信息
代理服务器
访问控制方法
联网设备
分割方法
轻量级分组密码算法
信用评分模型
信用评分方法
融合神经网络
号码
风险