声音事件检测数据合成及声音事件检测模型的训练方法

正文

推荐专利

申请号：CN202510684973

申请日期：2025-05-26

公开号：CN120877699A

公开日期：2025-10-31

类型：发明专利

摘要

本申请公开了一种基于语义提示的声音事件检测数据合成及声音事件检测模型的训练方法。通过将声音事件检测任务转化为语义描述信息，结合语义约束规则生成准确反映目标声音事件特征的结构化语义提示指令，实现语义描述到指令生成的自动化映射，降低人工干预成本。将该结构化语义提示指令输入音频生成模型，大规模合成音频数据，降低数据获取成本，提升样本多样性与可扩展性。结构化语义提示指令能指导模型批量合成多种声音事件类型的音频，且由大语言模型自动生成，确保合成音频与指令语义严格对齐。在标签生成时无需人工标注即可获取样本事件类别，为声音事件检测模型训练提供高效可靠的数据源。

技术关键词

事件检测模型语义音频指令样本规则集数据时间检测标签句法结构事件特征关键词覆盖率批量机制模板场景标识

系统为您推荐了相关专利信息

一种微生物标志物及其在甲状腺癌诊断中的应用

标志物甲状腺癌患者定量聚合酶链反应人体肠道微生物诊断甲状腺癌

一种多品牌机器人程序数据处理方法及系统

程序数据处理方法子模块指令数据处理系统抽象语法树

一种基于多域特征的电池组故障诊断方法及系统

多域特征故障诊断方法变分模态分解算法时域特征综合故障

一种多模态信息增强的水下鱼类图像语义分割方法

图像语义分割方法多模态信息文本编码器图像编码器 Gabor滤波器

一种基于长短时记忆网络的光度曲线异常检测方法

异常检测方法光度时序依赖关系曲线注意力

声音事件检测数据合成及声音事件检测模型的训练方法

站点导航

APP 下载