摘要
本发明公开了基于大语言模型的语音交互式图表动态生成方法及系统,涉及图表生成技术领域,包括,采集用户语音信号进行初步分帧和计算短时能量,分析静音段集合信号;对集合信号提取频域信号,通过滤波器计算增益对频域信号进行降噪,计算过零率和降噪短时能量筛选有效语音帧,进行峰值检测并计算平均语速进行语速归一化,提取帧内采样点的信号值。本发明所述方法通过对静音段进行FFT提取噪声功率谱密度,有效建立了背景噪声的频域模型,后续滤波器能够精确作用于实际存在的频带干扰区域,避免对语音主信号频谱造成削弱,通过帧加窗后的FFT计算功率谱后接入梅尔滤波器组,可依据人耳感知特性在对数梅尔尺度上重新分布能量。
技术关键词
动态生成方法
交互式图表
大语言模型
噪声功率谱密度
序列
信号值
滤波器
梅尔频率倒谱系数
指令
动态生成系统
麦克风阵列采集
TTS方法
命令
语音活动检测
云端
TTS技术
系统为您推荐了相关专利信息
光伏发电量
非易失性存储介质
序列
神经网络模型训练
历史运行数据
安全更新方法
安全更新系统
签名模块
固件升级失败
私钥