角色扮演模型的训练方法和装置

正文

推荐专利

角色扮演模型的训练方法和装置

申请号：CN202411508353

申请日期：2024-10-25

公开号：CN119415677A

公开日期：2025-02-11

类型：发明专利

摘要

本申请实施例提供了一种角色扮演模型的训练方法，该角色扮演模型的训练方法包括：获取多个角色的对话数据集和角色设定集，并基于所述多个角色的对话数据集和角色设定集构建多组训练数据；基于所述多组训练数据，对预先训练好的基座模型进行监督微调，得到初始角色扮演模型；获取偏好数据集，并基于所述偏好数据集对所述初始角色扮演模型进行偏好优化，得到目标角色扮演模型。本申请实施例提供的训练方法分阶段进行，每个阶段构建不同的训练样本用来优化基座模型，使模型可以对齐角色扮演任务、人类偏好和价值观，最终得到在对话能力、角色一致性和角色扮演吸引力等方面表现优秀的角色扮演模型。

技术关键词

文本数据角色扮演方法预训练模型角色扮演装置多轮对话预训练语言模型基座可读存储介质计算机程序产品训练装置处理器通信指令计算机设备媒体模块分阶段存储器

角色扮演模型的训练方法和装置

站点导航

APP 下载