摘要
本公开提供一种结合偏好学习的多智能体推荐方法、装置、电子设备、存储介质及程序产品,包括:确定查询用户的任务查询信息,对任务查询信息进行翻译,得到任务需求信息;基于查询用户、任务查询信息和任务需求信息进行推理,得到初始答案;通过预先训练的偏好学习对齐模型对初始答案进行评估,得到优化反馈;基于优化反馈对初始答案进行调整,得到优化推荐答案。本公开能够充分利用用户的精细偏好和上下文信息,进而提高推荐的相关性和准确性。
技术关键词
答案
更新模型参数
推荐方法
关键词
计算机程序指令
交互历史
数据
样本
电子设备
标签
计算机程序产品
推荐装置
画像
处理器
项目
模块
存储器
系统为您推荐了相关专利信息
结构化数据模型
剪贴板内容
监听器
关键词
模型库
金字塔结构
多尺度
记忆
交叉注意力机制
更新模型参数
监控视频传输方法
像素点
云平台
图像块
监控视频传输系统
多模态
数据处理方法
智能算法
生成方法
图像特征向量
护肤产品
个性化推荐方法
预训练模型
非暂态计算机可读存储介质
个性化推荐系统