摘要
本发明提供一种多模态内容生成方法、系统及存储介质,涉及多模态交互技术领域,所述方法包括:获取用户的文本描述,确定用户的需求类型、目标需求以及需求类型对应的单模态生成器;当存在多个需求类型时,通过每个需求类型对应的单模态生成器根据目标需求和用户的历史数据,生成每个需求类型对应的单模态内容;根据每个单模态内容进行对比,确定每个单模态内容分别与其他单模态内容的主题相似度;根据主题相似度对单模态内容进行更新,并将更新后的所有单模态内容进行融合,得到目标需求对应的多模态内容。本发明通过更新单模态内容消除不同模态之间在主题上的不协调问题,提高多模态内容与用户需求的匹配程度。
技术关键词
内容生成方法
关键词
跨模态
多模态
主题
智能体系统
文本生成器
图像生成器
自然语言生成技术
音频
子模块
内容生成系统
风格
聚类
计算机视觉技术
图像处理算法
深度学习模型
交互技术
策略
系统为您推荐了相关专利信息
概念
视频片段检索方法
查询特征
多层感知机
文本编码器
集团型企业
项目管理系统
绩效量化评估
科技创新
项目管理模块
性能评测方法
智能分析引擎
功能模块
专网
NoSQL数据库
自愈控制方法
故障诊断模型
决策树模型
节点
业务故障诊断