摘要
本发明涉及对话系统领域,公开了一种基于知识编辑的主动对话模型微调方法、终端及介质。该方法收集特定领域的主动对话数据集和通用的预训练数据集并进行预处理,数据集中的主动对话任务划分为模糊需求预测、主动提问及用户需求概述三个子任务;利用主动对话数据集和预训练数据集对添加有参数高效模块的预训练语言模型进行指令微调和二次预训练;在参数高效模块上提取和加强特定能力,从而得到预训练语言模型调整后的模型参数;基于调整后的模型参数,通过上下文学习触发主动提问能力,实现用户意图的动态挖掘。本发明通过微调主动对话模型,实现模型的主动提问来挖掘用户的潜在意图,以提升自己对于任务的可执行性的理解,指导后续的任务进行。
技术关键词
微调方法
预训练语言模型
编辑
参数
奇异值分解算法
矩阵
意图
计算机终端
对话系统
模块
处理器
数据格式
指令
可读存储介质
存储器
动态
系统为您推荐了相关专利信息
网络流量数据
流量识别模型
量子密钥管理系统
智能合约管理
加密方法
对位方法
图像特征关系
定位模组
机械臂关节
视觉