一种基于多模态模型的信息生成方法及相关设备

正文

推荐专利

申请号：CN202411937398

申请日期：2024-12-24

公开号：CN119763019A

公开日期：2025-04-04

类型：发明专利

摘要

本申请提供一种基于多模态模型的信息生成方法及相关设备，所述方法包括：对获取的视频数据进行特征提取，得到视频特征，视频特征包括静态特征和动态特征；根据获取的文本数据在预设数据库可以中确定目标提示语，预设数据库中存储有多个提示语，目标提示语为预设数据库中与文本数据匹配的提示语；基于预先训练的多模态模型将多模态数据映射至一个共享的语义嵌入空间，生成视频内容信息，多模态数据包括视频特征和目标提示语，视频内容信息为基于对话文本形式描述视频数据的信息。实现了不同模态之间在语义层面的深度融合，使得视频特征和文本形式的目标提示语能够直接进行语义关联和交互，提升了生成信息的准确性。

技术关键词

生成视频内容信息生成方法多模态数据文本静态特征模态特征音频特征信息生成装置图像分辨率视频编码器语义层面可读存储介质特征提取模块计算机程序产品处理器

系统为您推荐了相关专利信息

一种基于异步处理的电子社保卡平台应用方法

照片子系统通信服务数据处理业务 HTTP请求

一种吊车监护系统及基于预测的吊车维护方法

损伤特征结构件数据吊车结构监测传感器

一种基于共轭链推理和智能门控函数的社交媒体言论立场检测方法

智能门控节点链路代表社交

葡萄果实纵径全基因组选择育种方法

二代测序数据全基因组关联分析位点葡萄果实

一种新能源汽车OBD协议转换方法及系统

协议转换方法新能源汽车协议转换系统通信接口模块数据转换模块

一种基于多模态模型的信息生成方法及相关设备

站点导航

APP 下载