摘要
本发明公开了使用机器学习模型进行语音音频校正,具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括:将输入音频的第一转录与输入音频的第二转录进行比较,以识别修改后的词集,其中第二转录是第一转录的修改后的版本。该技术包括:基于修改后的词集使用文本转语音机器学习模型来生成合成音频,以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括:通过组合输入音频与修改后的合成音频来生成输出音频。
技术关键词
机器学习模型
音频
自动语音识别
有声读物
车载信息娱乐系统
噪声
虚拟现实内容
电路系统
自然语言
掩模
文本
协作内容
大语言模型
处理器
数字孪生
校正
数据中心
视频
机器人
系统为您推荐了相关专利信息
算法测试装置
分析模块
采集卡
时间延迟量
多通道
数据管理方法
数据分析模型
数据管理系统
决策
变电站基础
电脑主板故障
监测诊断系统
机器学习模型
数据处理单元
嵌入式存储模块
测试机构
智能穿戴设备
测试平台
测试箱体
测试方法