摘要
本申请公开了一种处理多模态混合数据并增强模型生成效果的方法,属于数据处理技术领域,本申请构建了多模态解析工具链,通过多模态解析工具链对多模态数据进行解析和特征提取,解决了数据处理难的问题,缩减了单条数据的处理时长,降低了数据处理成本,相比人工标注团队所需的工作站集群,硬件投入减少80%,本申请还通过建立多模态数据关联关系和图数据库实现了多模态数据的相互关联,解决了模态割裂的问题,且通过关联关系可实现文本搜图,文本搜表的技术效果,突破文本离散符号与图像连续表征的语义壁垒,实现图文内容关联响应。
技术关键词
文本段落
多模态
解析工具
对象存储集群
分布式数据存储
数据关联关系
实体
图像
表格
高密度
图文混排
邻近算法
置信度阈值
数据处理技术
语义向量
系统为您推荐了相关专利信息
多源异构数据
多通道卷积神经网络
加权特征
轨迹
融合方法
知识图谱构建方法
知识图谱构建系统
数值
数据
节点标识符
配电网设备状态
同步算法
动态时间规整算法
强化学习算法
设备状态评估
估计方法
人体三维姿态
多模态
物体
轻量级卷积神经网络
节点识别方法
大脑磁共振图像
网络
功能磁共振成像
脑成像数据