一种基于多模态模型的信息生成方法及相关设备

AITNT
正文
推荐专利
一种基于多模态模型的信息生成方法及相关设备
申请号:CN202411937398
申请日期:2024-12-24
公开号:CN119763019A
公开日期:2025-04-04
类型:发明专利
摘要
本申请提供一种基于多模态模型的信息生成方法及相关设备,所述方法包括:对获取的视频数据进行特征提取,得到视频特征,视频特征包括静态特征和动态特征;根据获取的文本数据在预设数据库可以中确定目标提示语,预设数据库中存储有多个提示语,目标提示语为预设数据库中与文本数据匹配的提示语;基于预先训练的多模态模型将多模态数据映射至一个共享的语义嵌入空间,生成视频内容信息,多模态数据包括视频特征和目标提示语,视频内容信息为基于对话文本形式描述视频数据的信息。实现了不同模态之间在语义层面的深度融合,使得视频特征和文本形式的目标提示语能够直接进行语义关联和交互,提升了生成信息的准确性。
技术关键词
生成视频内容 信息生成方法 多模态 数据 文本 静态特征 模态特征 音频特征 信息生成装置 图像 分辨率 视频编码器 语义层面 可读存储介质 特征提取模块 计算机程序产品 处理器
系统为您推荐了相关专利信息
1
一种基于异步处理的电子社保卡平台应用方法
照片 子系统 通信服务 数据处理业务 HTTP请求
2
一种吊车监护系统及基于预测的吊车维护方法
损伤特征 结构件 数据 吊车 结构监测传感器
3
一种基于共轭链推理和智能门控函数的社交媒体言论立场检测方法
智能门控 节点 链路 代表 社交
4
葡萄果实纵径全基因组选择育种方法
二代测序数据 全基因组关联分析 位点 葡萄 果实
5
一种新能源汽车OBD协议转换方法及系统
协议转换方法 新能源汽车 协议转换系统 通信接口模块 数据转换模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号