一种用于语音特征描述的语音标注方法和装置

AITNT
正文
推荐专利
一种用于语音特征描述的语音标注方法和装置
申请号:CN202411037101
申请日期:2024-07-31
公开号:CN118571229B
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供一种用于语音特征描述的语音标注方法和装置,涉及语音处理技术领域,方法包括:获取原始音频数据;将所述原始音频数据输入至预训练的语音风格识别模型中,得到所述原始音频数据的语音风格属性;其中,所述语音风格识别模型包括信号处理子模型、说话人身份识别子模型、情感标注子模型和韵律检测子模型;将所述语音风格属性和语音识别文本输入至预训练的自然语言模型中,得到所述原始音频数据对应的自然语言描述文本;其中,所述语音识别文本为:基于所述原始音频数据进行语音识别得到;所述自然语言描述文本为:对所述原始音频数据进行语音特征描述的文本。通过本发明提供的方法,形成针对原始音频数据详细和个性化的自然语言描述文本。
技术关键词
说话人身份识别 音频 自然语言模型 语音识别文本 语音标注方法 风格 标注系统 数据 话题识别 信号处理 识别模块 非暂态计算机可读存储介质 基础 年龄 处理器 标注装置 计算机程序产品
系统为您推荐了相关专利信息
1
基于时空特征融合的异常检测模型构建及异常检测方法
检测模型构建方法 空间特征提取 信号异常检测方法 音频 多尺度特征提取
2
一种事件聚合的短视频信息检测方法
节点特征 信息检测方法 模态特征 注意力机制 短视频
3
一种数据处理方法、装置及设备
数据处理模型 标注规则 辅助工具 大语言模型 多模态
4
一种数字人自动讲解静态PPT的视频制作方法
视频制作方法 文本 图像 视频制作装置 序列
5
一种语音处理方法及电子设备
声音采集器 电子设备 音频输出装置 动态语言模型 上下文特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号