文本特征提取方法、模型训练方法及相关装置

正文

推荐专利

申请号：CN202511065898

申请日期：2025-07-31

公开号：CN120950666A

公开日期：2025-11-14

类型：发明专利

摘要

本申请提供了一种文本特征提取方法、模型训练方法及相关装置，属于机器学习领域，包括：获取多个初始对话文本；通过预设文本提取模型对多个初始对话文本中每个初始对话文本进行标注，得到标注结果；根据标注结果从多个初始对话文本中确定目标训练样本数据；通过基座模型在目标训练数据集上分别执行标签数据提取任务和小结数据提取任务，并对基座模型进行第一次监督微调；通过微调后的基座模型执行标签数据和小结数据提取任务，并对进行第二次监督微调；构建偏好对数据集；根据偏好对数据集采用强化学习算法对基座模型进行优化，得到目标文本特征提取模型。可以实现对样本的高效筛选，以及提升模型整体性能与训练策略的适应性。

技术关键词

训练样本数据特征提取模型文本特征提取方法标签强化学习算法基座关键词模型训练方法微调单元对话生成模型编码特征提取装置损失函数优化训练装置处理器存储器电子设备

系统为您推荐了相关专利信息

一种船舶装载车辆定位系统

定位基站定位标签车辆定位系统电子围栏系统管理软件

问答题目筛选方法、装置、电子设备及存储介质

问答模型答案筛选方法筛选系统关键词

基于对称对比学习与轮廓感知的脊柱侧弯辅助筛查方法

语义特征轮廓边缘样本编解码器网络

电池状态控制方法、装置、设备及介质

电池状态控制方法健康状态数据电池组模型库状态控制装置

程序检测方法、装置、计算机设备及存储介质

多维特征向量编码器程序检测方法计算机执行指令序列

文本特征提取方法、模型训练方法及相关装置

站点导航

APP 下载