基于语音识别的英语口语发音矫正辅助系统

正文

推荐专利

基于语音识别的英语口语发音矫正辅助系统

申请号：CN202510906500

申请日期：2025-07-02

公开号：CN120412648B

公开日期：2025-09-09

类型：发明专利

摘要

本发明涉及智能语音识别领域，具体是基于语音识别的英语口语发音矫正辅助系统，包括数据采集模块、语音识别模块、发音分析模块和发音矫正模块；本发明采用一种基于维度融合与特征简化的视觉动作特征提取方法，捕捉嘴唇的动态动作和细微变化，准确识别标准发音的唇部动作的细节特征已经对应的文本语义，在降维的基础上增加通道数量，捕捉更深刻更细致的唇部视觉信息，为发音矫正提供更为准确的唇部动作指导；本发明通过语义特征引导对唇部动作的理解与识别，引入多头自注意力机制对语义特征进行优化，捕捉唇部动作与语音文本之间的关联关系，并添加对应的位置编码，使模型理解唇部动作中口语文本发音的顺序，实现更精确的唇部动作指导。

技术关键词

注意力机制矫正辅助系统动作特征提取方法文本语音识别模块视觉特征视频卷积特征提取语义特征提取矫正发音数据采集模块代表音频特征分析模块

系统为您推荐了相关专利信息

基于预训练模型的机电产品设计认知方案生成方法及系统

预训练语言模型机电产品设计预训练模型文本参数识别模型

一种基于多模态融合的结构变异过滤方法、装置及设备

位点生成结构带标签图片文本

一种基于亲和力预测的小分子配体药物筛选方法及系统

药物筛选方法配体亲和力矩阵变换特征

面向域外说话人适应场景的多层级解耦个性化语音合成方法及系统

个性化语音文本特征向量编码器音色特征音频

一种主题音乐生成方法、模型训练方法、装置及存储介质

音乐生成方法主题特征条件对抗网络生成模型训练方法交叉注意力机制

基于语音识别的英语口语发音矫正辅助系统

站点导航

APP 下载