自动音频标注系统、方法、电子设备和存储介质

AITNT
正文
推荐专利
自动音频标注系统、方法、电子设备和存储介质
申请号:CN202411451398
申请日期:2024-10-17
公开号:CN119418718A
公开日期:2025-02-11
类型:发明专利
摘要
本申请实施例公开自动音频标注系统、方法、电子设备和存储介质,其中,自动音频标注方法包括:获取音频信号,基于所述EAT模型从所述音频信号中提取所述音频表征;基于所述线性投影层将所述音频表征和与所述音频表征对应的文本嵌入对齐并下采样得到第一文本嵌入;至少基于所述大语言模型根据对齐并下采样后的所述音频表征和所述文本嵌入生成文本描述;基于所述策略计算模块计算各所述文本描述与所述音频信号的相似度并选取最匹配的文本描述作为所述自动音频标注系统的输出。
技术关键词
标注系统 大语言模型 文本 音频标注方法 适配器 字幕 信号 电子设备 策略 线性 处理器通信 模块 存储器 指令 解码
系统为您推荐了相关专利信息
1
智能对话产品的测试方法、装置、介质、设备及程序产品
机器学习模型 测试方法 页面 历史交互信息 数据存储系统
2
一种手势识别的方法和装置
手势 深度图像数据 三维坐标信息 多模态 关节点
3
一种文献检索语句的生成方法、系统及设备
结构化查询语句 生成方法 数据 多任务 工程优化方法
4
数据库的查询方法、装置、设备及介质
结构化查询语句 语义结构 自然语言 预训练语言模型 查询方法
5
矿压数据分类模型的训练方法和矿压数据分类方法
文本 数据分类方法 生成训练样本 数据分类模型训练 采煤机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号