模型训练方法、文本生成方法及装置

正文

推荐专利

模型训练方法、文本生成方法及装置

申请号：CN202511027504

申请日期：2025-07-24

公开号：CN120911405A

公开日期：2025-11-07

类型：发明专利

摘要

本申请公开了一种模型训练方法、文本生成方法及装置，用于在不显式输出推理过程（如CoT）的前提下，保留CoT所带来的深度理解和生成合规性，同时大幅度降低响应时延和计算资源消耗。所述模型训练方法包括：通过第一模型对样本文本进行编码，得到第一隐向量；所述样本文本包括第一提示词和参考推理过程文本，所述参考推理过程文本用于描述根据所述第一提示词得到参考回复文本的推理过程；通过第二模型，基于所述第一隐向量对所述第一提示词进行编码得到第二隐向量，以及基于所述第二隐向量，生成所述第一提示词的第一回复文本；基于所述第一回复文本和所述参考回复文本调整所述第二模型的参数，得到第三模型。

技术关键词

模型训练方法文本生成方法样本文本生成装置模型训练装置参数注意力矩阵编码模块合规性时延

系统为您推荐了相关专利信息

一种基于步态行为分析和面部识别的无扰式抑郁症识别方法

识别方法数据抑郁关节坐标

数据挖掘方法预测类别模型训练方法样本策略

裂缝网络页岩油气储层节点裂缝数量评价方法

数据管理系统曲线造价电力清洗规则

网页敏感信息异常识别方法生成网页样本网络

模型训练方法、文本生成方法及装置

站点导航

APP 下载