直觉世界模型、基于直觉世界模型的视觉推理方法及装置

AITNT
正文
推荐专利
直觉世界模型、基于直觉世界模型的视觉推理方法及装置
申请号:CN202510360048
申请日期:2025-03-25
公开号:CN120494085A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种直觉世界模型、基于直觉世界模型的视觉推理方法及装置,该直觉世界模型包括:搜索模块,用于对目标场景的视频数据进行视觉推理,得到目标场景中的多个对象的潜在变量;直觉交互模块,用于采用显示建模方法对潜在变量进行分解和计算,得到不同对象之间的交互信息,并根据交互信息更新多个对象的运动状态;根据多个对象的运动状态推导出各对象的运动规律参数,以执行目标推理任务。本发明所述直觉世界模型能够自主发现隐式物理属性、自主发现物理规律,并对物理事件进行显示解释,提高了世界模型的视觉推理准确率。
技术关键词
视觉推理 推理方法 加速度 静态特征 对象 搜索模块 物理 推理机制 非暂态计算机可读存储介质 特征提取模块 变量 建模方法 信息更新 运动 处理器 视频帧 场景 重建误差 数据获取模块
系统为您推荐了相关专利信息
1
一种基于时空大数据分析的地理场景区域建模方法
特征值 建模方法 时空大数据分析 上下文特征 模式
2
一种基于深度学习的交安设施统计调查方法
统计调查方法 稠密深度图 单目深度估计 图像 交通安全设施
3
一种基于Redis系统实现web请求幂等的方法、设备及介质
客户端 拦截器 校验方法 计算机可执行指令 对象
4
一种基于框匹配的鲁棒多模态3D目标检测方法
嵌入特征 多层感知机 前馈神经网络 图像 语义特征
5
一种基于大数据的金融管理咨询方法及系统
基准特征 大数据 滑动窗口 指标 编码器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号