一种基于单模型多任务推理的智慧座舱实现方法及系统

AITNT
正文
推荐专利
一种基于单模型多任务推理的智慧座舱实现方法及系统
申请号:CN202510700314
申请日期:2025-05-28
公开号:CN120510599A
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于单模型多任务推理的智慧座舱实现方法及系统,属于汽车电子领域,包括对智慧座舱内原始图像数据预处理后,将共享深度特征输入检测头和第一分类头,检测头的输出采用检测后处理得到目标检测锚框及位置信息,第一分类头的输出采用分类后处理得到分心识别分类;对目标检测锚框及位置信息进行预处理后,将人体区域子图像输入安全带识别分类模型;将人脸区域子图像并行输入疲劳识别分类模型、人脸ID匹配模型、注视点估计模型、视线估计模型及头部姿态估计模型;采集连续视频流中的人脸图像序列和语音序列,分别输入唇语识别模型和语音识别模型,将识别结果输入大语言模型处理后生成交互指令,通过语音合成模块输出响应。
技术关键词
多任务 座舱 大语言模型 人脸图像序列 头部姿态估计 语音识别模型 原始图像数据 唇语识别 注视点 特征提取网络 手部关键点 安全带 视频流 应急通风系统 联合训练方法 图像分类识别 语音识别文本
系统为您推荐了相关专利信息
1
基于大语言模型且可解释的行人轨迹预测方法、装置
行人轨迹预测方法 大语言模型 深度学习模型 模板 自然语言
2
具身模型表示方法及相关设备
节点 计算机程序产品 计算机设备 格式 可读存储介质
3
一种基于FPGA芯片的画质增强方法及装置
FPGA芯片 像素点 通道 图像 直方图
4
一种基于知识图谱大模型的视频描述方法
大语言模型 实体 生成知识图谱 关系 构建知识图谱
5
一种基于大语言模型的产业创新知识图谱动态构建方法
动态构建方法 大语言模型 三元组 标记机制 两阶段提交协议
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号