一种基于分步优化训练的越南语依存句法树库构建方法、系统

正文

推荐专利

申请号：CN202510357557

申请日期：2025-03-25

公开号：CN120297263A

公开日期：2025-07-11

类型：发明专利

摘要

本发明涉及一种基于分步优化训练的越南语依存句法树库构建方法、系统，属自然语言处理领域。包括：设计分块提示词、主从句识别提示词分别指导大模型对高质量越南语语料进行分块以及主从句识别任务，得到的分块数据集以及主从句数据集；设计思维链提示词，利用高质量越南语语料数据集、传统模型的伪依存句法树、分块数据和主从句数据，输入大模型通过迭代优化得到高质量的依存句法树库数据集并与公开依存句法树库进行融合后，加载到多语言预训练语言模型和双仿射依存句法分析模型中重新训练，得到句法解析性能更优的模型用于构建越南语依存句法树库。本发明方法有效缓解了越南语依存句法数据稀缺的问题，并显著提升了越南语依存句法分析的性能。

技术关键词

依存句法树库构建方法依存句法分析预训练语言模型分块数据非暂态计算机可读存储介质节点分词句法结构处理器构建系统文本自然语言格式存储器策略标签电子设备

系统为您推荐了相关专利信息

一种基于多智能体协作的大模型生成文本检测方法

多智能体协作文本检测方法句法结构预训练模型评分方法

一种网络威胁取证方法、程序产品、电子设备及存储介质

取证方法异常事件文本报告计算机程序指令

一种基于AI图像识别的通信铁塔监测系统

通信铁塔 AI图像识别风速传感器状态监测单元三维模型

一种基于机器视觉的土地整理边界线划分方法及系统

分块数字高程模型像素点划分方法卫星遥感图像

一种交通事故预测识别方法、系统、介质

交通事故预测识别方法预训练模型车辆数据

一种基于分步优化训练的越南语依存句法树库构建方法、系统

站点导航

APP 下载