一种结合句法信息和预训练语言模型的中文文本语法纠错方法

AITNT
正文
推荐专利
一种结合句法信息和预训练语言模型的中文文本语法纠错方法
申请号:CN202411669276
申请日期:2024-11-21
公开号:CN119578411B
公开日期:2025-09-30
类型:发明专利
摘要
本发明公开了一种结合句法信息和预训练语言模型的中文文本语法纠错方法,通过在预训练语言模型Chinese BART中融入句法信息,可有效提升中文语法纠错能力。该方法包括以下步骤:导入数据集并转换为目标格式;利用HanLP生成句法信息,将词性标签和依存关系转化为向量,与默认词嵌入进行融合;编码阶段使用句法增强的多头自注意力机制及残差网络;解码阶段利用自注意力机制和编码器‑解码器注意力机制结合句法信息进行生成,结合残差网络让解码器逐步优化;使用Beam Search来生成多个候选句,依据句法一致性和语义合理性选取最优候选句。本发明通过结合句法信息和预训练语言模型,让模型学习句子的语义信息并关注句法结构,有助于提升模型的中文语法纠错能力。
技术关键词
句法信息 交互注意力 训练语言模型 中文文本 解码器 纠错方法 编码器 注意力机制 句法依存关系 残差网络 标签 句法结构 自然语言 依存句法树 矩阵 前馈神经网络 数据
系统为您推荐了相关专利信息
1
基于RandLA-Net的电力廊道点云语义分割方法及系统
点云语义分割方法 标签类别 数据 邻域特征 K近邻算法
2
交互图像生成模型、交互图像的生成方法、装置及设备
交互特征 物体 纹理特征 网络 注意力
3
一种序列模型编辑方法、装置、电子设备及存储介质
模型编辑方法 关键词 序列 计算机可执行指令 矩阵
4
一种基于交叉伪监督半监督的急流轴自动提取方法
半监督深度学习 标签 图像分割 图像编码数据 风速
5
基于多模态大模型的芯片陶瓷封装基板表面缺陷检测方法
陶瓷封装基板 表面缺陷检测方法 融合特征 文本 像素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号