一种基于多模态信息融合的多维度人物关系发现方法

正文

推荐专利

申请号：CN202411827930

申请日期：2024-12-12

公开号：CN119760641A

公开日期：2025-04-04

类型：发明专利

摘要

本发明涉及人物关系的挖掘技术领域，具体涉及一种基于多模态信息融合的多维度人物关系发现方法，包括：从视频中提取文本、视觉和音频模态特征；模态特征的欧氏距离，进行最优对齐路径优化和非线性时间调整，得到时间步对齐的模态特征；模态特征进行自注意力和交叉注意力机制处理，获取文本、视觉和音频的多模态表示；文本、视觉和音频的多模态表示，建立社交关系、立场关系和共现关系的图结构网络；由所述社交关系、立场关系和共现关系的图结构确定视频中各人物的社交关系紧密程度、立场一致性程度和共现强度；本发明能够提高多维度人物关系的理解准确性。

技术关键词

模态特征关系发现方法多模态信息融合交叉注意力机制关系网络文本视觉节点建立社交关系表达式面部表情特征结构网络矩阵自动语音识别方法音频特征

一种基于多模态信息融合的多维度人物关系发现方法

站点导航

APP 下载