摘要
本申请实施例公开自动音频标注系统、方法、电子设备和存储介质,其中,自动音频标注方法包括:获取音频信号,基于所述EAT模型从所述音频信号中提取所述音频表征;基于所述线性投影层将所述音频表征和与所述音频表征对应的文本嵌入对齐并下采样得到第一文本嵌入;至少基于所述大语言模型根据对齐并下采样后的所述音频表征和所述文本嵌入生成文本描述;基于所述策略计算模块计算各所述文本描述与所述音频信号的相似度并选取最匹配的文本描述作为所述自动音频标注系统的输出。
技术关键词
标注系统
大语言模型
文本
音频标注方法
适配器
字幕
信号
电子设备
策略
线性
处理器通信
模块
存储器
指令
解码
系统为您推荐了相关专利信息
机器学习模型
测试方法
页面
历史交互信息
数据存储系统
结构化查询语句
生成方法
数据
多任务
工程优化方法
结构化查询语句
语义结构
自然语言
预训练语言模型
查询方法
文本
数据分类方法
生成训练样本
数据分类模型训练
采煤机