摘要
本发明提出一种面向场景理解的时序视听知识图谱自动生成方法,属于计算机领域。本发明将视频和音频数据作为场景理解的输入,并基于时间同步将其分割成连续的视听片段。接着,通过分割音频信号来识别无音频事件的背景时间段,并对有事件发生的片段进行采样。随后,利用实体和关系检测技术,在每个采样时刻生成视听知识图谱。最后,对生成的时序视听知识图谱进行关系补全,以提高其完整性和准确性。本发明提升了知识图谱的完整性和实用性,使系统能够自动推断和补全相关的视听关系,从而更好地支持场景理解和应用的智能化发展。
技术关键词
视听
时序
音频特征
图谱
实体
视觉特征
交叉注意力机制
场景
多模态
逻辑回归分类器
语义
视频帧特征
三元组
多层感知器
数据
系统为您推荐了相关专利信息
执行测试用例
机械臂
时空融合特征
自动化用例
误差
支持向量回归模型
节点
工业互联网安全
时序
网络拓扑关系
退化预测方法
电子系统
序列
时序预测模型
调制特征
水电机组检修
智能推荐方法
检修计划
计算机可读指令
推荐装置