摘要
本发明公开了一种基于指令监督微调与自演绎强化学习的意图生成方法,主要通过生成式意图分类模型生成意图,该生成式意图分类模型首先基于已知意图数据进行监督指令微调,然后基于自演绎对话进行强化学习;其中强化学习中,奖励函数包括语义相关性奖励和领域相关性奖励。本发明可突破传统静态聚类的局限性,在“收敛”与“发散”之间建立起动态平衡机制,从而提升意图生成模型在复杂多变场景下的泛化能力。
技术关键词
意图分类模型
生成方法
样本
标签
语义
文本
指令
参数
度函数
数据
注意力
编码器
表达式
邻域
索引
机制
场景
代表
阶段
系统为您推荐了相关专利信息
文本
生成方法
命名实体识别技术
关联规则挖掘算法
命名实体识别模型
索结构
多层卷积神经网络
振动测量方法
傅里叶变换算法
样本
语义先验
可见光图像
融合方法
深度学习网络模型
视觉特征