摘要
本申请涉及电数字处理的技术领域,公开一种基于多模态模型的档案信息检索方法,包括:对多模态档案进行处理后获得对应的数字档案;将数字档案输入多模态模型进行识别分类,获得对应的文本型描述信息;以描述性文本为根据,按照预设转化规则构建档案数据库对应后嵌入特征标签;根据档案数据库完成对神经网络模型的训练后,获得检索模型;将输入的文本型检索信息按照预设转化规则转化为检索图片;根据检索模型的输出结果获取检索结果;可减少图片、音频、视频等格式档案的检索难度,能够精简文档格式的档案数据内容,持续提升并保证检索的精准度,也降低了多模态档案的检索成本和门槛。
技术关键词
信息检索方法
多模态
分类正确率
标签
神经网络模型
阶段
文本
纸质文档
嵌入特征
图片
语句
逻辑
像素条
线条
音频
视频
样本
矩阵
矩形
系统为您推荐了相关专利信息
人工智能模型
数据获取模块
因子
多模态特征融合
场景
图像分割方法
K均值聚类算法
全卷积网络
混合损失函数
标签
数据存储单元
融合特征
多模态传感器
视觉图像传感器
注意力