基于大模型智能体的多模态数据融合方法及系统

正文

推荐专利

申请号：CN202510459336

申请日期：2025-04-14

公开号：CN120354357A

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了基于大模型智能体的多模态数据融合方法及系统，属于人工智能、大数据处理以及智能体技术领域，本发明要解决的技术问题为如何利用大模型智能体有效整合文本、图像、语音等不同模态的数据，提升智能体的感知、认知以及决策能力，采用的技术方案为：数据采集与预处理：通过网络爬虫、API接口、摄像头及麦克风设备采集文本、图像及语音多种模态数据，并对采集的数据进行预处理，获取预处理后的多模态数据，确保数据质量；特征提取与映射：通过CNN及Transformer模型从预处理后的多模态数据中提取对应的各模态特征，将不同模态特征映射到同一空间，并将对齐后的特征进行组合，形成综合特征表示；多模态融合处理；智能决策与反馈。

技术关键词

数据融合方法模态特征注意力机制决策融合技术数据特征提取多模态麦克风设备深度强化学习文本数据融合系统预训练模型语音交互注意力注意力模型爬虫融合策略矩阵分解技术图像

系统为您推荐了相关专利信息

一种基于被动成像的多谱段偏振光传输特性测试方法

特性测试方法偏振光偏振传输特性马尔可夫链蒙特卡罗法成像

基于深度学习耦合物理约束的冷却器堵塞预测方法

深度学习混合模型堵塞预测方法冷却器斯托克斯方程变换器模块

一种基于深度学习的多模态自适应计步方法及其系统

多尺度融合网络多模态特征计步方法融合特征加权特征

一种自然语言和图片协同定义的行为规范监管大模型系统

图片自然语言文本特征向量交互注意力规则集

一种基于多模态数据融合的设备状态监控方法及系统

设备状态监控方法多模态数据融合文本交叉注意力机制设备状态监控系统

基于大模型智能体的多模态数据融合方法及系统

站点导航

APP 下载