摘要
本发明公开了大语言模型智能体个性化响应生成方法及装置,涉及个性化推荐技术领域。包括:从历史交互行为中获取偏好集合,基于思维链为每个偏好构建一组偏好链;基于生成函数对当前时刻的交互行为进行改写,得到多个语义等价版本以及增强交互集合;基于评分函数确定每一组偏好链和增强交互集合的细粒度对齐得分以及每个偏好的相对强度;将当前时刻的交互行为和初始状态为空的响应前缀作为基础输入,针对每组偏好链构建提示模板;根据相对偏好强度对下一令牌概率分布进行加权求和,得到个性化目标分布,根据个性化目标分布逐词采样生成下一个令牌,将令牌拼接到响应前缀中并更新所述响应前缀,直到响应结束输出完整的个性化响应。
技术关键词
大语言模型
响应生成方法
令牌
响应生成装置
个性化推荐技术
强度
模板
意图
样本
计算机设备
处理器
语义
重构
可读存储介质
基础
存储器
系统为您推荐了相关专利信息
强化学习模型
深度Q网络
交通信号控制方法
大语言模型
基座
大语言模型
文本
图像
训练神经网络
深度神经网络模型
大语言模型
信息抽取系统
信息抽取方法
聚类分析方法
样本
多语言界面
大语言模型
文本
翻译界面
计算机程序产品