摘要
本发明公开了一种智慧黑板的多模态交互控制方法及系统,包括:获取用户的音视频数据流,生成音视频子段与课程数据及智慧黑板中实时课程内容切片匹配;获取用户的手势特征、语音特征及课程内容场景特征,进行自适应多模态融合,生成多模态数据流;构建交互识别分类模型,获取用户的交互控制偏好进行优化,输出用户的交互意图,利用交互意图生成控制响应;并将用户满意度反馈至交互识别分类模型进行识别分类性能优化,并持续更新用户的交互控制偏好。本发明采用多模态交互方式,提高了用户与智慧黑板人机交互的意图识别率及交互鲁棒性,同时大大减少了单模态交互中误识别率过大及交互过程复杂导致的识别效率低等异常状态。
技术关键词
智慧黑板
手势特征
场景特征
音视频
语音特征
交互控制方法
静态特征
多模态特征
意图
拉普拉斯金字塔
引入注意力机制
上下文特征
音频特征
视觉设备
交互控制系统
分类网络
系统为您推荐了相关专利信息
异常检测系统
RGB特征
光流特征
内存模块
多模态
机器人关节运动
语音识别方法
谐波特征
机械振动信号
融合特征
转换文本
大语言模型
语音生成方法
训练语音模型
音频
模型训练方法
语音识别模型
语音识别方法
功能模块
语音特征数据