基于文本引导的级联网络行人过街意图预测方法及系统

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
正文
推荐专利
基于文本引导的级联网络行人过街意图预测方法及系统
申请号:CN202511406677
申请日期:2025-09-29
公开号:CN120913180B
公开日期:2026-01-02
类型:发明专利
摘要
本发明提出了一种基于文本引导的级联网络行人过街意图预测方法及系统,涉及智能交通系统中的行人行为分析技术领域,该方法包括:使用车载摄像机采集道路视频,基于YOLO算法检测道路视频中的行人,提取具有连续帧的行人坐标序列;对行人坐标序列依次进行维度扩展和特征提取,获取与行人坐标序列对应的预测行人坐标;将行人坐标序列与预测行人坐标进行拼接,获取完整坐标序列特征;基于大语言模型生成的结构化提示词和行人过街视频,生成与结构化提示词对应的过街行为描述,将过街行为描述编码为行为描述特征;通过余弦相似度函数将完整坐标序列特征与行为描述特征进行特征对齐,获取行人意图预测结果。本申请有助于提升对行人动态意图的表达能力。
技术关键词
意图预测方法 坐标 序列特征 大语言模型 YOLO算法 车载摄像机 级联 输入解码器 文本特征向量 编码器 视频 分类策略 度函数 多层感知机 网络 视觉特征 预测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号