基于图像与文字的多模态识别算法

正文

推荐专利

基于图像与文字的多模态识别算法

申请号：CN202411514672

申请日期：2024-10-28

公开号：CN119380346A

公开日期：2025-01-28

类型：发明专利

摘要

本发明公开了基于图像与文字的多模态识别算法，适用于文物的状态监测与保护。该算法通过同步采集文物的图像信息和文字描述，利用去噪与OCR技术对数据进行预处理，生成标准化的图像和文字特征向量。然后，采用颜色、形状和纹理特征提取算法对图像进行多维特征提取，并通过多模态特征融合算法将图像与文字特征进行加权融合，生成综合特征向量。结合历史状态数据，基于深度学习模型对文物的当前状态进行评估，生成状态评估值和恢复指标，并通过反馈机制自动调整采集参数，优化数据采集流程。本发明能够实现文物状态的实时动态监测、智能化修复建议生成以及文物保护效果的优化，具有较强的适应性和广泛的应用前景。

技术关键词

识别算法纹理特征提取深度学习模型多模态特征融合数据高清摄像头颜色直方图伽马校正技术多层感知器文字特征 Gabor滤波器形状特征提取颜色特征提取二维图像信息指标

系统为您推荐了相关专利信息

基于全内存的遥感图像快速处理方法

内存遥感图像处理技术数据访问接口图像处理算法图像块

基于多传感器的秸秆干燥状态监测方法

密度分布模型状态监测方法气流传感器多传感器秸秆

一种基于物联网的网络安全通信控制系统

通信控制系统设备状态数据终端设备逻辑回归算法网络流量数据

基于LSTM模型预测儿童哮喘就诊人数的分析方法

儿童哮喘 LSTM模型多污染物分析方法滑动窗口

对羟基苯乙酮的血清暴露生物标志物及其在人体内负荷监测中的应用

暴露生物标志物苯乙酮高分辨质谱数据血清硫酸

基于图像与文字的多模态识别算法

站点导航

APP 下载