摘要
本发明提出了一种基于大语言模型协同的越南语依存句法数据增强方法,属于自然语言处理领域。该方法利用了多个当前主流的大语言模型作为多标注模型,生成越南语句子的初始依存句法树;通过引入分析效果更好的专家大语言模型GPT‑4o‑mini,对每一轮输出的依存树进行打分与反馈,驱动多标注模型迭代优化,直至达到设定阈值或最大轮数;在每句话的三个标注模型输出中,自动选取评分最高的依存句法树,形成高质量的合成越南语依存句法树。并将其与原始UD越南语训练集融合,完成句法分析模型的训练。该方法实现了对低资源语言越南语依存句法数据的高质量自动扩充,有效提升了依存分析性能。
技术关键词
依存句法树
大语言模型
数据
依存句法分析
解析句子
训练集
自然语言
解析器
句法结构
格式
语法结构
带标签
语义
机制
分词
组织
资源
基础
系统为您推荐了相关专利信息
智能巡检方法
异常状况
智能巡检系统
BERT模型
长短期记忆网络
数据获取请求
数据通信
菊花链架构
均衡控制方法
电芯
卷积网络模型
优化无线网络
全局特征提取
诊断模块
生成无线网络
信号监测系统
信号监测器
云端管理平台
网关
摆渡系统