摘要
本发明属于车机座舱系统技术领域,具体涉及一种基于OCR实现导航可见及可说的方法;监听TopActivity变化,根据packageName判定当前车机系统的TopActivity为导航画面;语音进入对话中状态,开启OCR扫描,并确认OCR开启;对车机系统当前画面进行截图;将图片压缩给云端OCR解析引擎,云端OCR解析引擎进行文字解析,车机系统根据解析结果重组为热词服务格式的json串;在本地形成热词列表;用户说出可见即可说指令,云端增强识别引擎给出最终自动语音识别结果;端侧对话管理模块判断ASR结果是否能够匹配到热词列表中的某一热词,通过热词列表找到ASR结果对应的控件;车机中语音模块执行虚拟点击动效,针对对应的控件执行步骤六用户所说的指令;本发明利用端侧截图和图片压缩工具,云端的OCR识别引擎将辅助服务不支持的导航App变成支持,增加了用户使用车机时通过语音操作导航的场景,提高了开车场景的安全性,降低了整车成本。
技术关键词
车机系统
自动语音识别
云端
控件
列表
画面
图片
座舱系统
活性检测
处理器
模块
指令
格式
计算机设备
坐标点
可读存储介质
存储器
场景
系统为您推荐了相关专利信息
接口方法
文件系统
静态分析技术
列表
AIDL文件