一种多语言文字转录方法及系统

正文

推荐专利

一种多语言文字转录方法及系统

申请号：CN202510036060

申请日期：2025-01-09

公开号：CN120029453A

公开日期：2025-05-23

类型：发明专利

摘要

本申请实施例公开了一种多语言文字转录方法及系统，应用于AR设备端，方法包括：通过AR设备端采集用户的第一待转录数据，并对第一待转录数据进行预处理，得到预处理后的待转录数据，第一待转录数据包括语音数据、视觉数据和动作数据；对第一待转录数据进行特征提取，得到第一待转录特征数据，第一待转录特征数据包括第一语音特征数据、第一视觉特征数据和第一动作特征数据；将第一语音特征数据输入预设的语种识别模型，输出初步目标语种数据，并将第一待转录特征数据和初步目标语种数据发送至边缘设备端；接收文本转录结果，并将文本转录结果显示到AR设备端上，可以有效解决AR设备端计算资源不足的问题，提高AR设备端转录的准确度和反应速度。

技术关键词

语音特征数据高维特征向量 AR设备动作特征视觉特征多模态特征转录方法设备端语种识别声学特征文本转录系统图像特征提取算法时域统计特征注意力机制 HMM模型数据接收模块深度神经网络

系统为您推荐了相关专利信息

系留无人机跟飞与精准降落靶标系统及方法

系留无人机靶标系统标记尺寸误差状态

基于机器学习的竖井物料冲击能量监测方法及系统

能量监测方法冲击特征材料特性参数井壁结构能量分布特征

视觉数据压缩方法、装置、设备及存储介质

保留特征数据压缩方法压缩特征视觉特征点数据压缩程序

基于多模态数据的影视资源推荐方法、装置、设备及存储介质

资源推荐模型影视资源推荐方法跨模态数据多模态

基于流变学模型的色母粒挤出成型缺陷预测方法及系统

缺陷预测方法壁面剪切应力色母粒粗糙度高维特征向量

一种多语言文字转录方法及系统

站点导航

APP 下载