一种基于OCR实现导航可见及可说的方法

正文

推荐专利

一种基于OCR实现导航可见及可说的方法

申请号：CN202410815815

申请日期：2024-06-24

公开号：CN118860325A

公开日期：2024-10-29

类型：发明专利

摘要

本发明属于车机座舱系统技术领域，具体涉及一种基于OCR实现导航可见及可说的方法；监听TopActivity变化，根据packageName判定当前车机系统的TopActivity为导航画面；语音进入对话中状态,开启OCR扫描，并确认OCR开启；对车机系统当前画面进行截图；将图片压缩给云端OCR解析引擎，云端OCR解析引擎进行文字解析，车机系统根据解析结果重组为热词服务格式的json串；在本地形成热词列表；用户说出可见即可说指令，云端增强识别引擎给出最终自动语音识别结果；端侧对话管理模块判断ASR结果是否能够匹配到热词列表中的某一热词，通过热词列表找到ASR结果对应的控件；车机中语音模块执行虚拟点击动效，针对对应的控件执行步骤六用户所说的指令；本发明利用端侧截图和图片压缩工具，云端的OCR识别引擎将辅助服务不支持的导航App变成支持，增加了用户使用车机时通过语音操作导航的场景，提高了开车场景的安全性，降低了整车成本。

技术关键词

车机系统自动语音识别云端控件列表画面图片座舱系统活性检测处理器模块指令格式计算机设备坐标点可读存储介质存储器场景

系统为您推荐了相关专利信息

复杂曲面表面加工的机器人轨迹时间参数化方法

参数化方法特征值曲线机械臂轨迹

用于联邦决策树的模型推理方法及装置

列表节点特征值对象分类特征

一种基于AOSP静态分析的Android攻击面探索方法

接口方法文件系统静态分析技术列表 AIDL文件

一种智能模拟面试的处理方法、系统及介质

大语言模型阶段生成智能资源分配模型库

一种脑循环功能障碍治疗仪及其控制方法

远红外热疗电刺激模块控制主机监测模块指标

一种基于OCR实现导航可见及可说的方法

站点导航

APP 下载