一种基于Transformer多模态融合策略的行人意图预测方法

AITNT
正文
推荐专利
一种基于Transformer多模态融合策略的行人意图预测方法
申请号:CN202410936312
申请日期:2024-07-12
公开号:CN118781575A
公开日期:2024-10-15
类型:发明专利
摘要
本发明公开一种基于Transformer结构的多模态融合策略的行人意图预测方法,目前基于RNN结构的行人意图预测能达到不错的性能,但是在处理行人意图预测序列数据时存在梯度消失以及大部分模型对于多模态特征之间融合不够深入,为解决这些问题,本发明提出一种多模态融合策略的Transformer模型,充分利用Transformer的优势,并且引入前置归一化技术用于稳定训练过程并提高模型的泛化能力,以及在该结构中加入额外的激活函数用于捕捉更复杂的特征和模式,改善梯度流动,有效处理行人运动的复杂性,并捕捉时间依赖性和多模态交互,更好地处理行人运动的复杂性。
技术关键词
意图预测方法 融合策略 解码模块 交叉注意力机制 非线性 预测序列数据 Sigmoid函数 时间序列信息 编码模块 网络 多模态特征 多层感知机 线性单元 高层次 动态地
系统为您推荐了相关专利信息
1
一种桥梁结构隐性损伤识别方法
桥梁结构 损伤识别方法 钢筋试件 预测误差 钢筋混凝土界面
2
数字人驱动方法、装置、设备及存储介质
音频特征 手部关键点 坐标 解码器 编码器
3
一种微电网集群的协同控制方法和系统
双向变换器 母线电压数据 协同控制方法 微电网 集群
4
一种面向稳定性提升的直压同步型构网变流器参数设计方法及其系统
变流器参数设计 非线性数学模型 闭环 直流母线电容 表达式
5
一种基于自适应多窗口跟踪的红外光斑质心定位优化方法
定位优化方法 多窗口 信息熵 形态学特征 红外光
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号