数据多模态表征方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
数据多模态表征方法、装置、电子设备及存储介质
申请号:CN202410832097
申请日期:2024-06-25
公开号:CN118690324A
公开日期:2024-09-24
类型:发明专利
摘要
本发明实施例公开了一种数据多模态表征方法、装置、电子设备及存储介质,该方法包括:获取待处理数据;基于待处理数据和预先训练得到的多模态表征模型,确定与待处理数据相对应的多模态表征向量;其中,多模态表征模型中包括视频处理子模型、文本处理子模型以及多模态解码器,视频处理子模型用于对视频帧序列和提示文本处理,文本处理子模型用于对文本内容和提示文本处理,多模态解码器用于对视频处理子模型和文本处理子模型输出的结果进行融合处理,得到建立视频帧序列和文本内容之间关联关系的多模态表征向量。通过本发明实施例的技术方案,以实现便捷、高效地建立视频帧序列和文本内容之间准确关联关系的多模态表征向量的技术效果。
技术关键词
多模态 文本 视频帧 解码器 表征方法 序列 样本 计算机可执行指令 视频编码 关系 电子设备 表征装置 视频流 数据获取模块 标签 处理器 注意力 存储装置
系统为您推荐了相关专利信息
1
一种基于AI视觉输液场景监控的识别系统及输液监控仪设备
识别系统 图像处理单元 可视化界面 限位框 输液监控仪
2
基于监督对比学习的电力系统暂态稳定分析方法和装置
分析电力系统 编码器 训练样本数据 暂态稳定分析 解码器
3
一种基于AI大模型的三维图像处理和展示的方法及系统
三维图像处理 三维图像数据 图像结构 自然语言 矩阵
4
一种基于改进RT-DETR的轻量化小目标检测方法
注意力 特征融合网络 参数转换方法 检测网络模型 模块
5
机器人的控制方法及装置、系统和机器人
智能模型 机器人 规划 参数 服务器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号