言语阻滞患者语音矫正方法、装置和存储介质

正文

推荐专利

申请号：CN202411016632

申请日期：2024-07-29

公开号：CN118553248A

公开日期：2024-08-27

类型：发明专利

摘要

本发明提供了一种言语阻滞患者语音矫正方法、装置和存储介质，涉及语音识别技术领域，包括：将待处理的语音转换为文本信息，生成输入文本；将输入文本输入T5模型进行优化和纠错，以获取纠错后的文本，期间在T5模型的解码器模块将正在生成的文本与正在生成的文本的上下文信息进行关联；基于VITS模型对纠错后的文本进行语音合成，以获取矫正后的语音，期间将BERT模型嵌入至VITS模型，以融合BERT模型的语言表示能力和VITS模型的序列生成效果。本发明不仅改善了纠错任务的整体质量，还增强了对个体差异的适应性，为口吃患者的矫正提供了更全面的解决方案。

技术关键词

矫正方法 BERT模型文本纠错患者语音矫正装置语音识别技术前馈神经网络存储程序指令可读存储介质序列解码器口吃存储器计算机注意力非线性阶段

系统为您推荐了相关专利信息

继电保护装置的控制方法、装置、设备及介质

继电保护装置动作识别模型电网运行数据人工智能技术长短期记忆网络

一种基于主张生成与一致性分析的社交文本立场识别方法和系统

文本语义情感词典识别方法话题关键词

面向牙科精准诊疗的CBCT-口扫数据实时交互分层配准系统及方法

数据实时交互配准系统锥形束计算机断层扫描分层交互机制

基于图像处理的神经外科医学影像分析方法和系统

血管壁病变特征医学影像分析方法图像检测模型患者

基于AI大模型的服务知识库管理系统

知识库管理系统性能监控事件驱动机制自然语言理解技术修正错别字

言语阻滞患者语音矫正方法、装置和存储介质

站点导航

APP 下载