摘要
本申请提供了一种文本特征提取方法、模型训练方法及相关装置,属于机器学习领域,包括:获取多个初始对话文本;通过预设文本提取模型对多个初始对话文本中每个初始对话文本进行标注,得到标注结果;根据标注结果从多个初始对话文本中确定目标训练样本数据;通过基座模型在目标训练数据集上分别执行标签数据提取任务和小结数据提取任务,并对基座模型进行第一次监督微调;通过微调后的基座模型执行标签数据和小结数据提取任务,并对进行第二次监督微调;构建偏好对数据集;根据偏好对数据集采用强化学习算法对基座模型进行优化,得到目标文本特征提取模型。可以实现对样本的高效筛选,以及提升模型整体性能与训练策略的适应性。
技术关键词
训练样本数据
特征提取模型
文本特征提取方法
标签
强化学习算法
基座
关键词
模型训练方法
微调单元
对话生成模型
编码
特征提取装置
损失函数优化
训练装置
处理器
存储器
电子设备
系统为您推荐了相关专利信息
定位基站
定位标签
车辆定位系统
电子围栏
系统管理软件
电池状态控制方法
健康状态数据
电池组
模型库
状态控制装置
多维特征向量
编码器
程序检测方法
计算机执行指令
序列