一种基于多标注者的越南语依存句法分析方法、系统、电子设备

正文

推荐专利

申请号：CN202510161292

申请日期：2025-02-13

公开号：CN119990102B

公开日期：2025-10-10

类型：发明专利

摘要

本发明涉及一种基于多标注者的越南语依存句法分析方法、系统、电子设备，属自然语言处理领域。本发明利用无标注数据对XLM RoBERTa模型的参数进行微调。接着使用UD树库训练一个初始的越南语依存句法分析模型，将句子输入该模型进行解析，生成含有噪声的伪数据。将这些伪数据输入到预先设计的提示模板中，利用大语言模型DeepSeek进行二次标注，通过提示学习逐步修正噪声数据，输出高质量的标注结果。最后，将二次标注后的伪数据作为额外的训练语料，与原始标注数据结合，训练新的越南语句法分析模型。本发明通过引入伪数据增强和多标注者协同优化机制，显著提升了模型在越南语依存句法解析任务中的性能。

技术关键词

依存句法分析方法依存句法树无标签数据上下文语义信息生成树电子设备模板预训练模型大语言模型字符噪声数据多语言自然语言处理器高层次解码

系统为您推荐了相关专利信息

一种智能化科室导诊的方法、装置及存储介质

医疗知识图谱医疗实体识别上下文语义信息计算机可读指令节点

存在标签噪声的工作负荷识别方法

信号特征负荷识别方法特征提取网络生理信号识别 K近邻分类器

基于自监督学习和多任务学习的病理图像分析方法及设备

多任务学习模型编码特征监督学习模型图像分析方法无标签数据

一种安全感知管理方法及平台

HMM算法命令隐马尔可夫模型主机对象

一种冠状动脉内支架三维半监督分割方法及装置

监督分割方法深度学习网络模型解码模块内支架解码器

一种基于多标注者的越南语依存句法分析方法、系统、电子设备

站点导航

APP 下载