基于大语言模型的语音交互式图表动态生成方法及系统

正文

推荐专利

申请号：CN202510816259

申请日期：2025-06-18

公开号：CN120496560A

公开日期：2025-08-15

类型：发明专利

摘要

本发明公开了基于大语言模型的语音交互式图表动态生成方法及系统，涉及图表生成技术领域，包括，采集用户语音信号进行初步分帧和计算短时能量，分析静音段集合信号；对集合信号提取频域信号，通过滤波器计算增益对频域信号进行降噪，计算过零率和降噪短时能量筛选有效语音帧，进行峰值检测并计算平均语速进行语速归一化，提取帧内采样点的信号值。本发明所述方法通过对静音段进行FFT提取噪声功率谱密度，有效建立了背景噪声的频域模型，后续滤波器能够精确作用于实际存在的频带干扰区域，避免对语音主信号频谱造成削弱，通过帧加窗后的FFT计算功率谱后接入梅尔滤波器组，可依据人耳感知特性在对数梅尔尺度上重新分布能量。

技术关键词

动态生成方法交互式图表大语言模型噪声功率谱密度序列信号值滤波器梅尔频率倒谱系数指令动态生成系统麦克风阵列采集 TTS方法命令语音活动检测云端 TTS技术

系统为您推荐了相关专利信息

一种减轻超关系内部噪声的知识图谱补全系统和方法

三元组知识图谱补全方法融合特征关系序列

向量量化大语言模型的算子融合机制分配方法与系统

大语言模型布局机制数据决策

预测光伏发电量的方法及装置、非易失性存储介质

光伏发电量非易失性存储介质序列神经网络模型训练历史运行数据

一种基于硬件特征与密码学的设备级固件安全更新方法及系统

安全更新方法安全更新系统签名模块固件升级失败私钥

电力系统负荷预测方法、装置、计算机设备、可读存储介质和程序产品

负荷周期指数平滑模型电力系统序列

基于大语言模型的语音交互式图表动态生成方法及系统

站点导航

APP 下载