基于图像与文字的多模态识别算法

AITNT
正文
推荐专利
基于图像与文字的多模态识别算法
申请号:CN202411514672
申请日期:2024-10-28
公开号:CN119380346A
公开日期:2025-01-28
类型:发明专利
摘要
本发明公开了基于图像与文字的多模态识别算法,适用于文物的状态监测与保护。该算法通过同步采集文物的图像信息和文字描述,利用去噪与OCR技术对数据进行预处理,生成标准化的图像和文字特征向量。然后,采用颜色、形状和纹理特征提取算法对图像进行多维特征提取,并通过多模态特征融合算法将图像与文字特征进行加权融合,生成综合特征向量。结合历史状态数据,基于深度学习模型对文物的当前状态进行评估,生成状态评估值和恢复指标,并通过反馈机制自动调整采集参数,优化数据采集流程。本发明能够实现文物状态的实时动态监测、智能化修复建议生成以及文物保护效果的优化,具有较强的适应性和广泛的应用前景。
技术关键词
识别算法 纹理特征提取 深度学习模型 多模态特征融合 数据 高清摄像头 颜色直方图 伽马校正技术 多层感知器 文字特征 Gabor滤波器 形状特征提取 颜色特征提取 二维图像信息 指标
系统为您推荐了相关专利信息
1
基于全内存的遥感图像快速处理方法
内存 遥感图像处理技术 数据访问接口 图像处理算法 图像块
2
基于多传感器的秸秆干燥状态监测方法
密度分布模型 状态监测方法 气流传感器 多传感器 秸秆
3
一种基于物联网的网络安全通信控制系统
通信控制系统 设备状态数据 终端设备 逻辑回归算法 网络流量数据
4
基于LSTM模型预测儿童哮喘就诊人数的分析方法
儿童哮喘 LSTM模型 多污染物 分析方法 滑动窗口
5
对羟基苯乙酮的血清暴露生物标志物及其在人体内负荷监测中的应用
暴露生物标志物 苯乙酮 高分辨质谱数据 血清 硫酸
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号