使用机器学习模型进行语音音频校正

正文

推荐专利

使用机器学习模型进行语音音频校正

申请号：CN202510197695

申请日期：2025-02-21

公开号：CN120544533A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开了使用机器学习模型进行语音音频校正，具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括：将输入音频的第一转录与输入音频的第二转录进行比较，以识别修改后的词集，其中第二转录是第一转录的修改后的版本。该技术包括：基于修改后的词集使用文本转语音机器学习模型来生成合成音频，以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括：通过组合输入音频与修改后的合成音频来生成输出音频。

技术关键词

机器学习模型音频自动语音识别有声读物车载信息娱乐系统噪声虚拟现实内容电路系统自然语言掩模文本协作内容大语言模型处理器数字孪生校正数据中心视频机器人

系统为您推荐了相关专利信息

一种基于同步采集卡的多通道有源降噪算法测试装置

算法测试装置分析模块采集卡时间延迟量多通道

一种电子周界数据管理方法、系统、电子设备和存储介质

数据管理方法数据分析模型数据管理系统决策变电站基础

一种电脑主板故障监测诊断系统

电脑主板故障监测诊断系统机器学习模型数据处理单元嵌入式存储模块

一种基于神经网络模型的数据识别方法、系统及应用

数据识别方法神经网络模型数值指标标记

一种智能穿戴设备的集成化测试平台和测试方法

测试机构智能穿戴设备测试平台测试箱体测试方法

使用机器学习模型进行语音音频校正

站点导航

APP 下载