摘要
本发明公开了一种基于语音指导的交互方法、装置、系统和介质,方法包括:获取语音信号,根据语音信号的音色确定语音发出者的角色;当确定语音发出者的角色为第一预设角色时,则根据指导语音控制播放设备,以使得播放设备播放所述指导语音所对应的视频影像;当确定所述语音发出者的角色为第二预设角色时,则将根据控制语音控制播放设备,以使得所述播放设备对当前播放的视频影像进行控制。通过设置两个不同的预设角色,通过对语音信号的音色的判断,确定所发出的语言是具有指导意涵还是控制意涵。从而根据不同的意涵来对播放设备进行控制。通过对指导语音的意涵进行可视化展示,提升不同角色之间的沟通效率。本发明主要用于智能交互技术领域。
技术关键词
控制语音控制
视频
交互方法
影像
摘要
文本
交互系统
场景
智能播放设备
智能交互技术
信号
计算机可读程序
智能投影仪
处理器
语义
标签
VR眼镜
系统为您推荐了相关专利信息
验收系统
通信基站
验收方法
设备身份认证
芯片存储设备
配准方法
深度特征提取网络
训练深度学习模型
灾害遥感
多尺度特征金字塔
入侵检测方法
人体关节点
姿态识别模型
人脸识别模型
计算机程序产品
区域识别方法
输出特征
融合特征
图像块特征
影像
跟踪方法
运动状态预测方法
轨迹置信度
分层
卡尔曼滤波