摘要
本发明提供一种多模态音视频信息融合传输方法和系统,通过前端融合和后端融合相结合的方式,实现多模态音视频信息的有效融合和传输,使得体感设备可以精确地根据用户的表现调整参数,克服现有音视频信息传输方法只能处理单模态信息,无法充分利用多模态信息间的互补性的问题。
技术关键词
音视频
融合传输系统
识别视频图像
音频
语义
存储程序代码
传输方法
人脸五官
分类器
特征值
数据同步
多模态信息
标识
补偿值
视觉
系统为您推荐了相关专利信息
生理监测参数
髋关节置换术
呼气末二氧化碳
脉搏血氧饱和度
患者护理系统
影像分类方法
多模态
嵌入特征
视网膜下积液
大语言模型
损伤识别方法
损伤识别模型
代表
注意力机制
图像