基于约束感知自学习推理的大语言模型指令优化方法

AITNT
正文
推荐专利
基于约束感知自学习推理的大语言模型指令优化方法
申请号:CN202510853690
申请日期:2025-06-24
公开号:CN120654834A
公开日期:2025-09-16
类型:发明专利
摘要
本发明提供了一种基于约束感知自学习推理的大语言模型指令优化方法方法,可以应用于自然语言处理和人工智能技术领域。该方法包括:在冷启动训练阶段,利用由预训练语言模型生成的思维链示例辅助目标大语言模型识别训练指令集中的约束,其中,训练指令集中的约束包括硬性约束和软性约束;利用思维链示例和训练标注数据对目标大语言模型进行监督微调以使目标大语言模型的思维链生成过程满足硬性约束和软性约束;在自我学习训练阶段,利用硬性约束和软性约束构建约束满意度评估机制,并基于约束满意度评估机制,通过强化学习算法对目标大语言模型的思维链生成策略进行优化。
技术关键词
大语言模型 强化学习算法 指令优化方法 自动问答系统 摘要 样本 文本 生成模板 机制 预训练语言模型 阶段 策略 数据 人工智能技术 风格 自然语言 时效性 标签
系统为您推荐了相关专利信息
1
一种基于通用大语言模型与知识图谱的个性化问答方法
大语言模型 邻居 图谱 问答方法 学生
2
智能机器人及其控制系统
机器人视觉 控制智能机器人 指令 数据 大语言模型
3
多源异构输电监测数据的边缘融合诊断系统及方法
多源异构数据 智能诊断模型 融合诊断方法 节点 诊断系统
4
面向大语言模型服务的数据差分隐私保护方法及装置
差分隐私保护方法 大语言模型 实体 哈希算法 数据隐私保护方法
5
智能推荐方法、装置、设备及存储介质
标签 交互内容 大语言模型 资料 画像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号