摘要
本发明提供一种用于语音特征描述的语音标注方法和装置,涉及语音处理技术领域,方法包括:获取原始音频数据;将所述原始音频数据输入至预训练的语音风格识别模型中,得到所述原始音频数据的语音风格属性;其中,所述语音风格识别模型包括信号处理子模型、说话人身份识别子模型、情感标注子模型和韵律检测子模型;将所述语音风格属性和语音识别文本输入至预训练的自然语言模型中,得到所述原始音频数据对应的自然语言描述文本;其中,所述语音识别文本为:基于所述原始音频数据进行语音识别得到;所述自然语言描述文本为:对所述原始音频数据进行语音特征描述的文本。通过本发明提供的方法,形成针对原始音频数据详细和个性化的自然语言描述文本。
技术关键词
说话人身份识别
音频
自然语言模型
语音识别文本
语音标注方法
风格
标注系统
数据
话题识别
信号处理
识别模块
非暂态计算机可读存储介质
基础
年龄
处理器
标注装置
计算机程序产品
系统为您推荐了相关专利信息
检测模型构建方法
空间特征提取
信号异常检测方法
音频
多尺度特征提取
节点特征
信息检测方法
模态特征
注意力机制
短视频
数据处理模型
标注规则
辅助工具
大语言模型
多模态
声音采集器
电子设备
音频输出装置
动态语言模型
上下文特征