一种基于大语言模型协同的越南语依存句法数据增强方法

AITNT
正文
推荐专利
一种基于大语言模型协同的越南语依存句法数据增强方法
申请号:CN202511034293
申请日期:2025-07-25
公开号:CN120930631A
公开日期:2025-11-11
类型:发明专利
摘要
本发明提出了一种基于大语言模型协同的越南语依存句法数据增强方法,属于自然语言处理领域。该方法利用了多个当前主流的大语言模型作为多标注模型,生成越南语句子的初始依存句法树;通过引入分析效果更好的专家大语言模型GPT‑4o‑mini,对每一轮输出的依存树进行打分与反馈,驱动多标注模型迭代优化,直至达到设定阈值或最大轮数;在每句话的三个标注模型输出中,自动选取评分最高的依存句法树,形成高质量的合成越南语依存句法树。并将其与原始UD越南语训练集融合,完成句法分析模型的训练。该方法实现了对低资源语言越南语依存句法数据的高质量自动扩充,有效提升了依存分析性能。
技术关键词
依存句法树 大语言模型 数据 依存句法分析 解析句子 训练集 自然语言 解析器 句法结构 格式 语法结构 带标签 语义 机制 分词 组织 资源 基础
系统为您推荐了相关专利信息
1
一种智能巡检系统、巡检方法、介质及计算机设备
智能巡检方法 异常状况 智能巡检系统 BERT模型 长短期记忆网络
2
均衡控制方法、装置、电子设备、存储介质和程序产品
数据获取请求 数据通信 菊花链架构 均衡控制方法 电芯
3
一种跨领域的图像分类方法
图像分类方法 图像分类模型 样本 数据 参数
4
一种基于树卷积网络模型优化无线网络的方法及系统
卷积网络模型 优化无线网络 全局特征提取 诊断模块 生成无线网络
5
基于网线互联的信号监测系统
信号监测系统 信号监测器 云端管理平台 网关 摆渡系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号