一种基于数据标签图结构的复杂指令生成方法

正文

推荐专利

申请号：CN202510079150

申请日期：2025-01-17

公开号：CN119884755A

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及一种基于数据标签图结构的复杂指令生成方法，包括：收集用于指令微调的数据集，采用问答对的形式；为收集到的开源数据打上标签；基于标签结果，得到标签类别，对相似标签进行聚合去重；存在共现关系的节点，将这两个节点关联起来，形成的标签关系图；利用图遍历算法来有效地获取标签组合；进入指令生成阶段；此阶段中，将标签组合作为输入，结合具体的生成模板，调用已经微调好的大语言模型进行文本生成；最后，生成的指令需要通过一系列的人工验证过程。解决了现有大模型在执行复杂、多步骤指令时表现出的跟随能力不足的问题，提高了数据生成的灵活性和广泛适应性，增强了语言模型的复杂指令处理能力，优化了数据生成的质量和效率。

技术关键词

指令生成方法数据标签遍历算法生成模板大语言模型标签类别一致性测试 Dijkstra算法自然语言理解技术打标签关系启发式搜索算法语义角色标注文本生成模型广度优先搜索深度优先搜索生成对抗网络

系统为您推荐了相关专利信息

一种基于大语言模型的用户情绪识别与心理干预的系统及方法

大语言模型干预方法情绪状态检测社交机器人自然语言理解

一种基于大模型的文本处理方法、系统、终端及存储介质

文本处理方法大语言模型列表文本处理系统校正

一种基于AI的船舶定位方法及系统

船舶定位方法位置误差补偿预测误差广义模糊规则

基于大模型的代码生成与自动程序修复的模糊测试方法及系统

自动程序修复模糊测试方法生成代码阶段纠错

无监督的普通话粤语翻译方法、装置与计算机可读存储介质

翻译模型文本矩阵解码器翻译方法

一种基于数据标签图结构的复杂指令生成方法

站点导航

APP 下载