摘要
本申请实施例公开了一种多语言文字转录方法及系统,应用于AR设备端,方法包括:通过AR设备端采集用户的第一待转录数据,并对第一待转录数据进行预处理,得到预处理后的待转录数据,第一待转录数据包括语音数据、视觉数据和动作数据;对第一待转录数据进行特征提取,得到第一待转录特征数据,第一待转录特征数据包括第一语音特征数据、第一视觉特征数据和第一动作特征数据;将第一语音特征数据输入预设的语种识别模型,输出初步目标语种数据,并将第一待转录特征数据和初步目标语种数据发送至边缘设备端;接收文本转录结果,并将文本转录结果显示到AR设备端上,可以有效解决AR设备端计算资源不足的问题,提高AR设备端转录的准确度和反应速度。
技术关键词
语音特征数据
高维特征向量
AR设备
动作特征
视觉特征
多模态特征
转录方法
设备端
语种识别
声学特征
文本
转录系统
图像特征提取算法
时域统计特征
注意力机制
HMM模型
数据接收模块
深度神经网络
系统为您推荐了相关专利信息
能量监测方法
冲击特征
材料特性参数
井壁结构
能量分布特征
保留特征
数据压缩方法
压缩特征
视觉特征点
数据压缩程序
资源推荐模型
影视资源推荐方法
跨模态
数据
多模态
缺陷预测方法
壁面剪切应力
色母粒
粗糙度
高维特征向量