一种基于大语言模型协同的越南语依存句法数据增强方法

正文

推荐专利

申请号：CN202511034293

申请日期：2025-07-25

公开号：CN120930631A

公开日期：2025-11-11

类型：发明专利

摘要

本发明提出了一种基于大语言模型协同的越南语依存句法数据增强方法，属于自然语言处理领域。该方法利用了多个当前主流的大语言模型作为多标注模型，生成越南语句子的初始依存句法树；通过引入分析效果更好的专家大语言模型GPT‑4o‑mini，对每一轮输出的依存树进行打分与反馈，驱动多标注模型迭代优化，直至达到设定阈值或最大轮数；在每句话的三个标注模型输出中，自动选取评分最高的依存句法树，形成高质量的合成越南语依存句法树。并将其与原始UD越南语训练集融合，完成句法分析模型的训练。该方法实现了对低资源语言越南语依存句法数据的高质量自动扩充，有效提升了依存分析性能。

技术关键词

依存句法树大语言模型数据依存句法分析解析句子训练集自然语言解析器句法结构格式语法结构带标签语义机制分词组织资源基础

系统为您推荐了相关专利信息

一种智能巡检系统、巡检方法、介质及计算机设备

智能巡检方法异常状况智能巡检系统 BERT模型长短期记忆网络

均衡控制方法、装置、电子设备、存储介质和程序产品

数据获取请求数据通信菊花链架构均衡控制方法电芯

一种跨领域的图像分类方法

图像分类方法图像分类模型样本数据参数

一种基于树卷积网络模型优化无线网络的方法及系统

卷积网络模型优化无线网络全局特征提取诊断模块生成无线网络

基于网线互联的信号监测系统

信号监测系统信号监测器云端管理平台网关摆渡系统

一种基于大语言模型协同的越南语依存句法数据增强方法

站点导航

APP 下载