摘要
本发明提供一种多模态知识库生成方法、多模态信息检索增强生成方法及数字人多模态交互方法,涉及多模态交互技术领域,该方法通过解析目标文件中的文本内容和多模态信息,并将文本内容与多模态信息的多模态标签进行融合,通过知识拆分的方式得到知识卡片,进而生成多模态知识库,从而对目标文件中的知识进行了拆分,便于后续的知识检索,为大语言模型提供知识储备,提高大语言模型提供的响应内容的准确性和可靠性,降低其AI幻觉出现的概率。不仅如此,由于知识卡片中包含有多模态标签,因此可以生成包含有多模态信息的响应内容,进而丰富响应内容的多样性,提高用户的交互体验。
技术关键词
知识卡片
知识库生成方法
多模态信息
信息检索
语义特征
交互方法
大语言模型
文本
标签
生成数字人
语句
冗余
编辑
表格
生成装置
主题
数据
处理器