摘要
本申请公开了一种回复策略的输出方法,应用于大语言模型,大语言模型包括预先训练的价值函数,价值函数是基于历史输入数据、历史输入数据对应的历史回复策略,以及针对历史回复策略的用户响应数据训练得到的,用户响应数据与多个标签中的目标标签匹配,目标标签用于指示用户响应数据所对应的情感类别,包括:获取待处理的输入数据;对输入数据进行处理,生成回复策略;基于价值函数对输入数据和回复策略进行处理,得到回复策略属于多个标签中的每个标签的概率;基于回复策略属于每个标签的概率和回复策略,确定目标回复策略并输出。这样可以有效降低计算成本。
技术关键词
策略
标签
情感类别
大语言模型
正面
可读存储介质
存储计算机程序
数据获取模块
处理器
存储器
输出模块
终端设备
电子设备
指令
系统为您推荐了相关专利信息
数据分级保护方法
计算机网络环境
风险
动态
防护系统
风电机组轴承
剩余使用寿命
在线预测方法
线性插值方法
风电轴承
策略优化模型
通信调度设备
资源分配策略
通信资源分配方法
业务分配
旅游商品
推荐方法
非易失性存储介质
查询意图
数据