摘要
基于ALBert模型的中文电力文本错误检测方法及系统,包括:对电力文本进行分词处理,提取短语作为不可分割单元,并根据文本长度动态调整分词粒度,将分词结果输入ALBert模型嵌入层生成包含字符级、词语级和上下文关联的语义向量;语义向量经过特征提取模块,结合文本的长度、复杂度和错误分布特征,通过调整卷积核参数和多层卷积操作提取字符级、词语级和句法级特征,并融合生成全局错误特征向量;从全局错误特征向量中提取错误标签,通过序列建模模块调整标签间的依赖关系权重,生成并优化错误标签序列;根据优化后的错误标签序列,结合上下文关系生成修正建议,输出错误位置、类型和修正内容的结构化检测结果,提供错误分布图和修正建议列表适应场景。
技术关键词
错误检测方法
文本
词语
字符
分词
语义向量
特征提取模块
句法结构
序列
电力
多层卷积神经网络
分布特征
复杂度
特征加权融合
分析标签
错误特征
关系
错误检测系统
系统为您推荐了相关专利信息
自然语言理解
多模态交互
对象
深度学习架构
意图
大语言模型
事件关联分析方法
生成事件
关系
事件触发词
格式化
处理器上执行程序
位置映射算法
模型检测技术
错误检测方法