使用机器学习模型进行语音音频校正

AITNT
正文
推荐专利
使用机器学习模型进行语音音频校正
申请号:CN202510197695
申请日期:2025-02-21
公开号:CN120544533A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了使用机器学习模型进行语音音频校正,具体公开了使用机器学习模型来校正语音音频的系统和技术。该技术包括:将输入音频的第一转录与输入音频的第二转录进行比较,以识别修改后的词集,其中第二转录是第一转录的修改后的版本。该技术包括:基于修改后的词集使用文本转语音机器学习模型来生成合成音频,以及基于合成音频和输入音频的至少一部分使用话音匹配机器学习模型来生成修改后的合成音频。该技术包括:通过组合输入音频与修改后的合成音频来生成输出音频。
技术关键词
机器学习模型 音频 自动语音识别 有声读物 车载信息娱乐系统 噪声 虚拟现实内容 电路系统 自然语言 掩模 文本 协作内容 大语言模型 处理器 数字孪生 校正 数据中心 视频 机器人
系统为您推荐了相关专利信息
1
一种基于同步采集卡的多通道有源降噪算法测试装置
算法测试装置 分析模块 采集卡 时间延迟量 多通道
2
一种电子周界数据管理方法、系统、电子设备和存储介质
数据管理方法 数据分析模型 数据管理系统 决策 变电站基础
3
一种电脑主板故障监测诊断系统
电脑主板故障 监测诊断系统 机器学习模型 数据处理单元 嵌入式存储模块
4
一种基于神经网络模型的数据识别方法、系统及应用
数据识别方法 神经网络模型 数值 指标 标记
5
一种智能穿戴设备的集成化测试平台和测试方法
测试机构 智能穿戴设备 测试平台 测试箱体 测试方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号