一种视听觉跨模态物体材质检索方法及系统

AITNT
正文
推荐专利
一种视听觉跨模态物体材质检索方法及系统
申请号:CN202411611954
申请日期:2024-11-13
公开号:CN119557828A
公开日期:2025-03-04
类型:发明专利
摘要
本发明提供一种视听觉跨模态物体材质检索方法及系统,涉及人工智能技术领域。该视听觉跨模态物体材质检索系统,包括:数据采集,采集包含多种材质物体的视觉图像和相应的音频数据;特征提取,分别对视觉和听觉数据进行特征提取,视觉特征包括但不限于颜色、纹理和形状,听觉特征包括但不限于频谱特征和时域特征;特征融合,设计一个融合算法,将视觉和听觉特征进行有效融合,形成跨模态特征表示;检索模型,该模型能够学习跨模态特征与物体材质之间的映射关系。通过结合视觉和听觉信息,系统能够更全面地理解物体的特性,视觉信息可以提供物体的外观特征,而听觉信息可以提供关于物体材质的动态特性,这种融合有助于提高材质识别的准确性。
技术关键词
听觉 跨模态 检索系统 物体 深度学习模型 视觉特征 数据 时域特征 融合算法 高保真麦克风 音频 图像缩放 融合策略 频谱特征提取 图像边缘信息 颜色特征提取
系统为您推荐了相关专利信息
1
基于激光点云的三维缺陷一体化检测方法
一体化检测方法 RANSAC算法 基准 点云 弯曲特征
2
一种基于大数据分析的畜牧疫病预警方法及系统
关联特征数据 畜牧 地理信息系统 基因 高风险
3
一种蛋白质-蛋白质相互作用位点预测方法及装置
预测蛋白质序列 位点预测方法 矩阵 语义特征 深度学习模型
4
物料分拣系统
物料分拣系统 多模态 文本处理模型 人机交互模块 特征提取网络
5
一种基于跨域三维高斯溅射增强视觉定位方法和系统
图像定位模型 视觉定位方法 光度 多层感知器 动态物体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号