摘要
本申请属于声音监测领域,尤其是一种宠物声音监测方法,其包括以下步骤:对叫声片段起止时间和典型叫声类别进行人工标注和扩展处理;对叫声片段及非叫声片段进行编码;对各编码单元进行随机采样;构造训练数据集;将训练集中的单元拓展为多通道,进行特征提取,并重构为新的多通道单元;进行模型设计;输入完整的宠物记录音频,输出二维结构;生成多个子序列,将子序列转换为叫声片段的起止时间和叫声类别进行输出。与现有技术相比,本发明在少量数据标注的情况下,通过将声音编码为序列,使得模型能够自适应地识别不同长度的声音片段,并在声音类型识别中引入序列处理方法,既提升了识别的灵活性和准确性,又增加了结果的可解释性。
技术关键词
声音监测方法
序列
编码
分类阈值
多通道
构建卷积神经网络
数据
音频
多层次
代表
采样点
网络特征
声学特征
重构
谱估计
典型
训练集
样本
滤波器
系统为您推荐了相关专利信息
识别语音信号
语音情感识别方法
语音情绪识别
脉冲
机器人交互