摘要
本发明提供了一种图像嵌入方法及系统,该方法通过获取检察卷宗中的图像,并对图像进行预处理,随后使用大型语言模型生成预处理的图像的文本摘要;获取检察卷宗中的元数据,并结合文本摘要和元数据,进行证据分类,得到各证据类别,其中,元数据为从检察卷宗中提取的与案件相关的信息;针对各证据类别,将预处理后的图像输入YOLOv10模型和SAM2模型,并使用基于Transformer的融合模块进行分析,得到定量分析结果和定性分析结果;根据文本摘要、定量分析结果以及定性分析结果,生成报告,并嵌入到向量数据库,具体的,通过将文本摘要和元数据的多模态数据输入特定模型中进行分析,有效提升了图像分析的深度和精度。
技术关键词
图像嵌入方法
组合特征向量
卷积神经网络提取特征
文本编码器
摘要
生成报告
注意力机制
数据
双线性池化
特征提取单元
案件
分析模块
拼接单元
处理器
图像分析