一种回复策略的输出方法、装置、设备和存储介质

正文

推荐专利

申请号：CN202510856026

申请日期：2025-06-24

公开号：CN120763290A

公开日期：2025-10-10

类型：发明专利

摘要

本申请公开了一种回复策略的输出方法，应用于大语言模型，大语言模型包括预先训练的价值函数，价值函数是基于历史输入数据、历史输入数据对应的历史回复策略，以及针对历史回复策略的用户响应数据训练得到的，用户响应数据与多个标签中的目标标签匹配，目标标签用于指示用户响应数据所对应的情感类别，包括：获取待处理的输入数据；对输入数据进行处理，生成回复策略；基于价值函数对输入数据和回复策略进行处理，得到回复策略属于多个标签中的每个标签的概率；基于回复策略属于每个标签的概率和回复策略，确定目标回复策略并输出。这样可以有效降低计算成本。

技术关键词

策略标签情感类别大语言模型正面可读存储介质存储计算机程序数据获取模块处理器存储器输出模块终端设备电子设备指令

系统为您推荐了相关专利信息

一种计算机数据分级保护方法及动态防护系统

数据分级保护方法计算机网络环境风险动态防护系统

一种用于火电机组的机组协调控制系统及方法

发电设备机组协调控制方法功率控制曲线火电

有限样本下的风电机组轴承剩余使用寿命在线预测方法

风电机组轴承剩余使用寿命在线预测方法线性插值方法风电轴承

基于元联邦强化学习的通信资源分配方法和系统

策略优化模型通信调度设备资源分配策略通信资源分配方法业务分配

旅游商品推荐方法、系统、电子设备及存储介质

旅游商品推荐方法非易失性存储介质查询意图数据

一种回复策略的输出方法、装置、设备和存储介质

站点导航

APP 下载