摘要
本发明涉及一种基于数据标签图结构的复杂指令生成方法,包括:收集用于指令微调的数据集,采用问答对的形式;为收集到的开源数据打上标签;基于标签结果,得到标签类别,对相似标签进行聚合去重;存在共现关系的节点,将这两个节点关联起来,形成的标签关系图;利用图遍历算法来有效地获取标签组合;进入指令生成阶段;此阶段中,将标签组合作为输入,结合具体的生成模板,调用已经微调好的大语言模型进行文本生成;最后,生成的指令需要通过一系列的人工验证过程。解决了现有大模型在执行复杂、多步骤指令时表现出的跟随能力不足的问题,提高了数据生成的灵活性和广泛适应性,增强了语言模型的复杂指令处理能力,优化了数据生成的质量和效率。
技术关键词
指令生成方法
数据标签
遍历算法
生成模板
大语言模型
标签类别
一致性测试
Dijkstra算法
自然语言理解技术
打标签
关系
启发式搜索算法
语义角色标注
文本生成模型
广度优先搜索
深度优先搜索
生成对抗网络
系统为您推荐了相关专利信息
大语言模型
干预方法
情绪状态检测
社交机器人
自然语言理解
文本处理方法
大语言模型
列表
文本处理系统
校正
船舶定位方法
位置误差补偿
预测误差
广义
模糊规则