一种用于智能眼镜的语音信息处理方法、装置及智能眼镜

正文

推荐专利

申请号：CN202510883395

申请日期：2025-06-26

公开号：CN120388567A

公开日期：2025-07-29

类型：发明专利

摘要

本申请公开了一种用于智能眼镜的语音信息处理方法、装置及智能眼镜。通过接收智能眼镜采集的环境音频并使用预先构建的多模态转换模型进行多模态解析翻译处理，生成包含语言词元和音色向量的输出项。这些输出项经过时间标记，其中时间与记录时间段相对应。随后，通过音色向量在音色库中的检索，确定每个输出项对应的发言用户。针对同一发言用户的各输出项，根据它们的时间标记进行时序拼接，生成该用户的目标数据，确保这些内容的标注有发言时间，指示了内容起始时间。最后，将各用户生成的目标数据通过智能眼镜进行输出和显示。本申请可以实现说话者身份识别和多语言同步翻译。

技术关键词

智能眼镜声纹特征解码单元语音信息处理方法多模态音频转换文本语音信息处理装置扬声器模块标记信息处理系统音色特征时间段识别用户语音时序数据传输模块矩阵

系统为您推荐了相关专利信息

基于企业微信的农牧供应链语音交互系统及模型驱动方法

语音交互系统模型驱动方法后台业务系统企业微信号

基于多模态特征融合的情感分析方法、装置、设备及介质

情感分析模型多模态特征融合情感分析方法交互特征融合特征

基于微调大语言模型的任务处理方法、装置、设备及介质

大语言模型矩阵算法多任务计算机可读指令

基于目标检测与深度语义关键点提取的水下自主建图方法

自主建图方法关键点动态物体图像配准精度自主系统

一种机器人的交互处理方法、装置、设备、计算机可读存储介质及计算机程序产品

计算机可执行指令机器人交互多模态方式反馈特征计算机程序产品

一种用于智能眼镜的语音信息处理方法、装置及智能眼镜

站点导航

APP 下载