环境声学模拟语音生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510844797

申请日期：2025-06-23

公开号：CN120612917B

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种环境声学模拟语音生成方法、装置、设备及介质，包括：获取并分离混合语音数据，生成原始语音内容和原始环境声学信息；将原始语音内容转换为第一文本信息；结合原始环境声学标签、第一文本信息和目标地理位置信息确定目标环境声学标签；基于该标签从预设声音数据集合中获取目标环境声学信息，并调节其幅度特性以匹配原始环境声学信息；将调节后的目标环境声学信息与原始语音内容合成为模拟语音数据。本发明通过引入目标地理位置信息参与声学特征确定与幅度调节，使生成的模拟语音数据在地理语义和声学表现上更加一致，有效提升语音环境伪装的真实性和隐蔽性。

技术关键词

语音生成方法地理位置信息标签能量分布特征文本生成程序声学特征数据多维特征向量细粒度分类时序特征频谱特征音频采集设备生成装置语音识别模型方言词汇计算机设备语音识别模块执行噪声

系统为您推荐了相关专利信息

电力行业问题的处理方法、装置、存储介质及电子设备

大语言模型关键词答案语句文本

一种基于自适应知识图谱增强LLM的函件智能问答系统的构建方法

智能问答系统图谱评分机制转换器 SPARQL查询

一种基于认知差异的跨平台话题传播趋势预测方法

话题趋势预测方法邻居多元线性回归模型状态转换概率

基于不确定性或概率的伪标记

机器学习模型计算机标签数据深度神经网络

商品分类方法及其装置、设备、介质

商品分类方法多维特征向量文本编码向量格式化

环境声学模拟语音生成方法、装置、设备及介质

站点导航

APP 下载