基于语音识别的光影控制方法、装置、设备及介质

正文

推荐专利

申请号：CN202510793539

申请日期：2025-06-13

公开号：CN120636392A

公开日期：2025-09-12

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技、医疗健康等业务场景中，公开了一种基于语音识别的光影控制方法、装置、设备及介质，包括：获取语音输入并确定声源方向定位结果，并进行语音识别生成语音文本信息并解析为控制指令，对交互区域的图像信息进行目标检测生成目标定位结果，将声源方向定位结果与目标定位结果进行空间匹配，确定发出控制指令的目标用户，生成光影参数并根据目标用户的位置调整光影参数的空间分布，将调整后的光影参数转换为灯光控制信号，执行灯光控制信号以生成目标光影动画。本发明通过多模态协同实现了基于用户声音和位置的动态交互，能够准确识别并绑定用户控制指令，动态调整光影效果，提升互动性和个性化体验。

技术关键词

灯光控制信号灯光设备参数生成语音生成控制指令动画麦克风阵列采集图像运动轨迹数据灯光控制模块空间分布信息多模态协同实时位置语音采集模块麦克风单元坐标文本

系统为您推荐了相关专利信息

用于部署阶段的模型优化方法、装置、设备及存储介质

图像识别模型模型优化方法样本数值阶段

一种基于智能合约的电力市场交易规则优化方法及系统

支持向量机模型电力交易市场组合赋权法能源指标

考虑配电网承载能力的电能替代演化路径预测方法及系统

电能企业路径预测方法规模配电网参数

基于DNA遗传模型的Word文档处理方法及系统

算术平均值指数计算机程序指令主题语义文本段落

一种上跨既有隧道的隧道开挖扰动监测方法

新建隧道三维模型实时监测数据监测方法时序

基于语音识别的光影控制方法、装置、设备及介质

站点导航

APP 下载