摘要
本发明提供的AI录音场景下音频数据压缩传输的方法以及系统,包括:在录音设备的AI录音场景下,获取纯净音频数据;基于深度学习模型对所述纯净音频数据进行音频内容分析,得到音频内容分析结果;根据所述音频内容分析结果,结合自适应比特率调整策略,采用混合编码算法对所述纯净音频数据进行编码,得到初步编码音频数据;利用lame库,根据录音设备的硬件性能、存储空间和网络带宽动态调整压缩参数,并对所述初步编码音频数据进行压缩,得到压缩音频数据;其中,所述压缩参数包括压缩比;将所述压缩音频数据传输至目标设备。在本发明中,动态调整压缩参数,克服当前无法自适应调整压缩参数造成压缩效率不佳的缺陷。
技术关键词
音频
录音设备
数据压缩
编码算法
参数
模糊推理规则
深度学习模型
场景
字符
模糊隶属度
动态
信息熵计算方法
网络带宽波动
矩阵
复杂度
长短期记忆网络
强化学习模型
策略
系统为您推荐了相关专利信息
对话系统
语音识别模块
对话方法
生成数字人
工具包
累积误差
卡尔曼滤波模型
时间同步
多传感器系统
协方差矩阵
医疗影像数据处理
特征提取模型
无损压缩方法
深度学习算法
整合医疗影像