一种基于自适应多模态信息融合的人物观点提取方法

正文

推荐专利

申请号：CN202510111943

申请日期：2025-01-24

公开号：CN120032295A

公开日期：2025-05-23

类型：发明专利

摘要

本发明涉及一种基于自适应多模态信息融合的人物观点提取方法，属于视频人物观点提取技术领域，本发明基于自适应的多模态的信息特征融合，完成了说话人物身份的识别；通过融合视觉信息以及音频信息，并使用自适应权重进行融合，不同模态可以根据实际任务的重要性自适应调整权重，增强模型的灵活性和稳健性；本发明利用图神经网络GNN提取观点，通过其多层消息传递机制实现跨多个节点的推理能力，帮助系统识别出更复杂的观点关系和隐含的结论，即使某些发言人未明确表达他们的观点，图神经网络GNN可以通过邻居节点的传播信息推断出该发言人的潜在态度。

技术关键词

观点提取方法多模态信息融合音频特征模态特征 BERT模型主题文本消息传递机制视觉特征提取说话人身份多任务卷积神经网络视频视觉注意力模型梅尔频率倒谱系数人脸面部特征图像视觉特征

系统为您推荐了相关专利信息

一种基于人工智能的健康体检数据分析方法及系统

结构化报告数据体检数据分析方法时空融合特征生成对抗网络医学影像数据

一种基于人工智能的皮带机保护预警方法及系统

模态特征保护预警方法机器状态数据预警模型激光扫描模块

基于多模态特征融合的电力数据分析方法及系统

企业电力数据分析方法多模态特征融合文本聚类

一种防晕车智能减震控制系统

减震控制系统控制策略防晕车车辆行驶状态悬挂控制器

一种基于情感识别的AI交互方法及系统

交互方法情感识别模型多模态特征融合重构模型策略

一种基于自适应多模态信息融合的人物观点提取方法

站点导航

APP 下载