摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种环境声学模拟语音生成方法、装置、设备及介质,包括:获取并分离混合语音数据,生成原始语音内容和原始环境声学信息;将原始语音内容转换为第一文本信息;结合原始环境声学标签、第一文本信息和目标地理位置信息确定目标环境声学标签;基于该标签从预设声音数据集合中获取目标环境声学信息,并调节其幅度特性以匹配原始环境声学信息;将调节后的目标环境声学信息与原始语音内容合成为模拟语音数据。本发明通过引入目标地理位置信息参与声学特征确定与幅度调节,使生成的模拟语音数据在地理语义和声学表现上更加一致,有效提升语音环境伪装的真实性和隐蔽性。
技术关键词
语音生成方法
地理位置信息
标签
能量分布特征
文本
生成程序
声学特征
数据
多维特征向量
细粒度分类
时序特征
频谱特征
音频采集设备
生成装置
语音识别模型
方言词汇
计算机设备
语音识别模块
执行噪声
系统为您推荐了相关专利信息
智能问答系统
图谱
评分机制
转换器
SPARQL查询
话题
趋势预测方法
邻居
多元线性回归模型
状态转换概率
商品分类方法
多维特征向量
文本
编码向量
格式化