摘要
本公开提供了浏览器的语音交互控制方法、装置、电子设备及存储介质,获取用户输入的语音控制指令,并基于语音控制指令确定目标控制意图;获取浏览器当前的网页页面对应的目标文档对象模型树;将目标控制意图以及目标文档对象模型树发送至服务器,并接收服务器基于目标控制意图以及目标文档对象模型树生成的至少一个控制指令;执行至少一个控制指令,控制网页页面渲染与所述语音控制指令对应的交互结果。这样,可以减少针对于每个网站均进行维护开发以及穷举所有网页功能生成指令集的步骤,有助于提升浏览器语音交互控制的控制效率。
技术关键词
语音交互控制方法
文档对象模型
语音控制指令
浏览器扩展组件
语音交互控制装置
意图
控制网页页面
自然语言
语音交互功能
网页元素
语音采集装置
大语言模型
浏览器语音交互
服务器
页面数据
客户端
机器可读指令
页面结构
声音播放设备
系统为您推荐了相关专利信息
橡胶轮胎设备
语音控制指令
语音识别模型
语音控制方法
文本
界面组件
命令
生成方法
内容显示
虚拟文档对象模型
语音控制指令
设备语音控制方法
自然语言识别
音频特征提取
家居设备控制