摘要
本发明涉及数字化技术领域,提供了一种基于AR设备的文档批注方法和装置。方法包括:实时接收来自AR设备的实时影像和实时音频,对所述实时影像进行进行场景目标识别;还对所述实时影像进行指示动作的识别;其中,所述指示动作识别包括鼠标、手指或指示物在信息载体上的停留动作;根据识别得到的指示动作,确定所指示的待批注文档的实时位置;对所述实时音频进行同步的语音识别,得到语义信息,将所述语义信息作为批注内容添加到所述待批注文档的实时位置。本发明通过使用AR设备采集实时影像和实时音频,并对实时影像和实时音频进行分析,生成得到文档批注,从而无需人工参与,即可实现沟通过程中对文档的实时批注,从而便于后期对沟通过程的追溯。
技术关键词
文档批注方法
AR设备
信息载体
实时位置
语义
影像
声纹特征
计算机可执行指令
音频
计算机存储介质
纸质文档
鼠标
电子屏幕
麦克风
文本识别
场景
处理器通信
系统为您推荐了相关专利信息
风险
增值服务方法
强化学习框架
双向注意力机制
序列标注模型
特征融合网络
检测输电线路
深度学习模型
巡检图像
特征提取网络