摘要
本发明涉及人工智能技术领域和金融科技领域,公开了一种音频数据标注方法,通过获取音频数据,利用性别分类器确定性别属性,利用口音分类器确定口音属性,分析音频质量以获取信噪比和早晚期反射比值,分析音高特征以获取说话者平均音高和音高标准差,计算音素数量与音频长度的比值以确定说话速度属性。针对每种属性生成对应的关键字,并基于这些关键字生成音频数据的标注信息。本发明通过分析音频数据的多种属性,生成对应的关键字,显著提高了音频数据标注的效率和准确性。离散化处理将连续属性(如说话速度、信噪比等)转换为简单的类别名称,简化了复杂数据的处理,使系统在分类、检索和扩展性方面更加高效。
技术关键词
音频数据标注方法
关键字
自然语言
信噪比
性别分类器
背景噪声
标注装置
时频分析技术
生成音频数据
速度
频谱分析模块
模板
语音识别技术
计算机设备
识别模块
人工智能技术
系统为您推荐了相关专利信息
大语言模型
时序神经网络
分析系统
人物关系图谱
模型训练模块
工业资产关联
业务流程数据
业务流程信息
大语言模型
分析方法
智能匹配系统
智能匹配方法
匹配模块
关键字
模型库