摘要
本发明公开了一种多模态输入的婴儿意图识别方法及装置,包括:获取含有婴儿全身的视频数据及对应的婴儿啼哭数据;将含有婴儿全身的视频数据及对应的婴儿啼哭数据输入婴儿意图识别模型中,对婴儿意图进行识别;本发明同步采集视频和音频信息,同时使用婴儿面部表情、肢体动作、啼哭声音作为输入,使用深度神经网络进行端到端预测婴儿意图,准确率得到了提升。
技术关键词
婴儿
意图识别方法
意图识别模型
人脸检测模型
多模态
人脸特征向量
图像数据预处理
意图识别装置
视频
域名解析服务
服务器
音频
模块
训练肢体
人体关键点
系统为您推荐了相关专利信息
深度强化学习模型
机器人导航方法
计算机可读指令
障碍物
数据
降水预测方法
多模态特征融合
特征提取网络
融合特征
权重特征
多模态
识别方法
神经网络模型训练
可见光图像
特征提取网络
人体代谢率
乘员
石墨烯加热垫
数值迭代算法
服装热阻
动态风险评估方法
堤防
风险评估模型
多模态特征
矩阵