一种用于语音特征描述的语音标注方法和装置

正文

推荐专利

申请号：CN202411037101

申请日期：2024-07-31

公开号：CN118571229B

公开日期：2024-10-29

类型：发明专利

摘要

本发明提供一种用于语音特征描述的语音标注方法和装置，涉及语音处理技术领域，方法包括：获取原始音频数据；将所述原始音频数据输入至预训练的语音风格识别模型中，得到所述原始音频数据的语音风格属性；其中，所述语音风格识别模型包括信号处理子模型、说话人身份识别子模型、情感标注子模型和韵律检测子模型；将所述语音风格属性和语音识别文本输入至预训练的自然语言模型中，得到所述原始音频数据对应的自然语言描述文本；其中，所述语音识别文本为：基于所述原始音频数据进行语音识别得到；所述自然语言描述文本为：对所述原始音频数据进行语音特征描述的文本。通过本发明提供的方法，形成针对原始音频数据详细和个性化的自然语言描述文本。

技术关键词

说话人身份识别音频自然语言模型语音识别文本语音标注方法风格标注系统数据话题识别信号处理识别模块非暂态计算机可读存储介质基础年龄处理器标注装置计算机程序产品

系统为您推荐了相关专利信息

基于时空特征融合的异常检测模型构建及异常检测方法

检测模型构建方法空间特征提取信号异常检测方法音频多尺度特征提取

一种事件聚合的短视频信息检测方法

节点特征信息检测方法模态特征注意力机制短视频

一种数据处理方法、装置及设备

数据处理模型标注规则辅助工具大语言模型多模态

一种数字人自动讲解静态PPT的视频制作方法

视频制作方法文本图像视频制作装置序列

一种语音处理方法及电子设备

声音采集器电子设备音频输出装置动态语言模型上下文特征

一种用于语音特征描述的语音标注方法和装置

站点导航

APP 下载