基于指令监督微调与自演绎强化学习的意图生成方法

AITNT
正文
推荐专利
基于指令监督微调与自演绎强化学习的意图生成方法
申请号:CN202510889712
申请日期:2025-06-30
公开号:CN120804817A
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种基于指令监督微调与自演绎强化学习的意图生成方法,主要通过生成式意图分类模型生成意图,该生成式意图分类模型首先基于已知意图数据进行监督指令微调,然后基于自演绎对话进行强化学习;其中强化学习中,奖励函数包括语义相关性奖励和领域相关性奖励。本发明可突破传统静态聚类的局限性,在“收敛”与“发散”之间建立起动态平衡机制,从而提升意图生成模型在复杂多变场景下的泛化能力。
技术关键词
意图分类模型 生成方法 样本 标签 语义 文本 指令 参数 度函数 数据 注意力 编码器 表达式 邻域 索引 机制 场景 代表 阶段
系统为您推荐了相关专利信息
1
一种基于多源数据与AI的采购需求生成方法及系统
文本 生成方法 命名实体识别技术 关联规则挖掘算法 命名实体识别模型
2
一种索结构的振动测量方法、装置、设备及介质
索结构 多层卷积神经网络 振动测量方法 傅里叶变换算法 样本
3
一种基于深度学习与规则范式的飞机外形测量视点生成方法
视点生成方法 飞机 生成规则 深度学习网络 坐标
4
语义先验引导红外和可见光图像融合方法、系统、设备及存储介质
语义先验 可见光图像 融合方法 深度学习网络模型 视觉特征
5
一种多模态数字细胞基础模型的构建方法
结点 基因调控网络 基础 数据 消息传递机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号