摘要
本发明涉及一种基于分步优化训练的越南语依存句法树库构建方法、系统,属自然语言处理领域。包括:设计分块提示词、主从句识别提示词分别指导大模型对高质量越南语语料进行分块以及主从句识别任务,得到的分块数据集以及主从句数据集;设计思维链提示词,利用高质量越南语语料数据集、传统模型的伪依存句法树、分块数据和主从句数据,输入大模型通过迭代优化得到高质量的依存句法树库数据集并与公开依存句法树库进行融合后,加载到多语言预训练语言模型和双仿射依存句法分析模型中重新训练,得到句法解析性能更优的模型用于构建越南语依存句法树库。本发明方法有效缓解了越南语依存句法数据稀缺的问题,并显著提升了越南语依存句法分析的性能。
技术关键词
依存句法树
库构建方法
依存句法分析
预训练语言模型
分块
数据
非暂态计算机可读存储介质
节点
分词
句法结构
处理器
构建系统
文本
自然语言
格式
存储器
策略
标签
电子设备
系统为您推荐了相关专利信息
多智能体协作
文本检测方法
句法结构
预训练模型
评分方法
通信铁塔
AI图像识别
风速传感器
状态监测单元
三维模型
分块
数字高程模型
像素点
划分方法
卫星遥感图像