言语阻滞患者语音矫正方法、装置和存储介质

AITNT
正文
推荐专利
言语阻滞患者语音矫正方法、装置和存储介质
申请号:CN202411016632
申请日期:2024-07-29
公开号:CN118553248A
公开日期:2024-08-27
类型:发明专利
摘要
本发明提供了一种言语阻滞患者语音矫正方法、装置和存储介质,涉及语音识别技术领域,包括:将待处理的语音转换为文本信息,生成输入文本;将输入文本输入T5模型进行优化和纠错,以获取纠错后的文本,期间在T5模型的解码器模块将正在生成的文本与正在生成的文本的上下文信息进行关联;基于VITS模型对纠错后的文本进行语音合成,以获取矫正后的语音,期间将BERT模型嵌入至VITS模型,以融合BERT模型的语言表示能力和VITS模型的序列生成效果。本发明不仅改善了纠错任务的整体质量,还增强了对个体差异的适应性,为口吃患者的矫正提供了更全面的解决方案。
技术关键词
矫正方法 BERT模型 文本 纠错 患者 语音矫正装置 语音识别技术 前馈神经网络 存储程序指令 可读存储介质 序列 解码器 口吃 存储器 计算机 注意力 非线性 阶段
系统为您推荐了相关专利信息
1
继电保护装置的控制方法、装置、设备及介质
继电保护装置 动作识别模型 电网运行数据 人工智能技术 长短期记忆网络
2
一种基于主张生成与一致性分析的社交文本立场识别方法和系统
文本 语义 情感词典 识别方法 话题关键词
3
面向牙科精准诊疗的CBCT-口扫数据实时交互分层配准系统及方法
数据实时交互 配准系统 锥形束计算机断层扫描 分层 交互机制
4
基于图像处理的神经外科医学影像分析方法和系统
血管壁 病变特征 医学影像分析方法 图像检测模型 患者
5
基于AI大模型的服务知识库管理系统
知识库管理系统 性能监控 事件驱动机制 自然语言理解技术 修正错别字
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号