基于多模态信息的设备控制方法及装置、存储介质及电子装置

AITNT
正文
推荐专利
基于多模态信息的设备控制方法及装置、存储介质及电子装置
申请号:CN202510882547
申请日期:2025-06-27
公开号:CN120748392A
公开日期:2025-10-03
类型:发明专利
摘要
本申请公开了一种基于多模态信息的设备控制方法及装置、存储介质及电子装置,涉及智慧家庭技术领域,该方法包括:通过预设识别模型识别出用户的语音信号对应的语义信息,对语义信息和元数据分别进行特征编码,得到第一特征向量和第二特征向量;通过语义信息确定目标权重调整策略,得到调整了融合权重后的第二特征向量;融合第一特征向量和调整了融合权重后的第二特征向量,以确定语音信号和第一视觉媒体数据的匹配得分,并按照匹配得分通过第一设备显示第一视觉媒体数据中与语音信号匹配的第二视觉媒体数据;对第二视觉媒体数据中的第三视觉媒体数据进行解析,得到第三视觉媒体数据对应的指令集合,并按照指令集合控制第二设备。
技术关键词
设备控制方法 多模态信息 媒体 语义 视觉 语音识别网络 数据 输入接口 信号 注意力机制 编码 可视化交互界面 麦克风阵列采集 电子装置 频域特征 策略 智慧家庭技术 设备控制装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号