多模态对话模型的训练方法以及对应的人机对话方法

正文

推荐专利

申请号：CN202410713940

申请日期：2024-06-03

公开号：CN118504654A

公开日期：2024-08-16

类型：发明专利

摘要

本申请提供一种多模态对话模型的训练方法以及对应的人机对话方法。本申请通过在获取到用于模型训练的第一文本数据以及目标数据库中与第一文本数据匹配的图像数据的情况下，基于第一文本数据中文本关键词的位置，确定图像数据在第一文本数据中的插入位置，从而按照插入位置，将用于指示图像数据在目标数据库中存储位置的图像链接插入第一文本数据中，得到第二文本数据，进而基于第二文本数据来训练多模态对话模型，以得到能够输出文本和图像的多模态对话模型，提高人机对话过程的信息交互效率，提升用户体验。

技术关键词

多模态对话文本人机对话方法关键词提取模型图像生成模型人机对话装置计算机设备数据存储实体处理器场景训练装置词语模块存储器程序物体

多模态对话模型的训练方法以及对应的人机对话方法

站点导航

APP 下载