基于指令监督微调与自演绎强化学习的意图生成方法

正文

推荐专利

申请号：CN202510889712

申请日期：2025-06-30

公开号：CN120804817A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于指令监督微调与自演绎强化学习的意图生成方法，主要通过生成式意图分类模型生成意图，该生成式意图分类模型首先基于已知意图数据进行监督指令微调，然后基于自演绎对话进行强化学习；其中强化学习中，奖励函数包括语义相关性奖励和领域相关性奖励。本发明可突破传统静态聚类的局限性，在“收敛”与“发散”之间建立起动态平衡机制，从而提升意图生成模型在复杂多变场景下的泛化能力。

技术关键词

意图分类模型生成方法样本标签语义文本指令参数度函数数据注意力编码器表达式邻域索引机制场景代表阶段

系统为您推荐了相关专利信息

一种基于多源数据与AI的采购需求生成方法及系统

文本生成方法命名实体识别技术关联规则挖掘算法命名实体识别模型

一种索结构的振动测量方法、装置、设备及介质

索结构多层卷积神经网络振动测量方法傅里叶变换算法样本

一种基于深度学习与规则范式的飞机外形测量视点生成方法

视点生成方法飞机生成规则深度学习网络坐标

语义先验引导红外和可见光图像融合方法、系统、设备及存储介质

语义先验可见光图像融合方法深度学习网络模型视觉特征

一种多模态数字细胞基础模型的构建方法

结点基因调控网络基础数据消息传递机制

基于指令监督微调与自演绎强化学习的意图生成方法

站点导航

APP 下载