语音文本对齐模型训练方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411543224

申请日期：2024-10-31

公开号：CN119418690B

公开日期：2025-12-05

类型：发明专利

摘要

本申请提供了一种语音文本对齐模型训练方法、装置、电子设备及存储介质，涉及大模型领域。其中，该方法包括：获取预训练模型和文本数据，并基于所述预训练模型针对文本数据中的各单词进行时间信息预测，获得对应各所述单词的时间预测结果；获取语音数据，并基于所述时间预测结果对所述语音数据进行文本重建，获得重建文本数据；基于动态规划算法对所述重建文本数据和所述语音数据进行最优对齐路径预测，获得最优对齐路径；基于所述最优对齐路径对所述预训练模型进行参数调整，获得语音文本对齐模型。本申请解决了相关技术中语音文本对齐模型的适用性不高的问题。

技术关键词

预训练模型动态规划算法模型训练方法文本特征向量数据语音编码器计算机可读指令文本编码器文本段落电子设备模型训练装置参数处理器模块存储器注意力序列时序

系统为您推荐了相关专利信息

基于机器视觉的3D深度学习缺陷检测方法

缺陷检测方法深度学习模型三维图像数据深度学习网络提取可视化技术

显示模组及显示装置

显示模组柔性电路板电容检测组件触控感应接口

算子级并行报文解析方法、装置、计算机设备和存储介质

报文解析方法节点连线解析算法报文解析装置

基于分布式计算的多物理场模型仿真的数据脱敏系统

脱敏数据数据脱敏系统网络拓扑结构代表综合数据处理

一种基于多模态数据融合的银行异常交易检测方法

交易检测方法多模态数据融合指纹特征数据银行交易系统跨模态

语音文本对齐模型训练方法、装置、电子设备及存储介质

站点导航

APP 下载