基于语音识别的英语口语发音矫正辅助系统

AITNT
正文
推荐专利
基于语音识别的英语口语发音矫正辅助系统
申请号:CN202510906500
申请日期:2025-07-02
公开号:CN120412648B
公开日期:2025-09-09
类型:发明专利
摘要
本发明涉及智能语音识别领域,具体是基于语音识别的英语口语发音矫正辅助系统,包括数据采集模块、语音识别模块、发音分析模块和发音矫正模块;本发明采用一种基于维度融合与特征简化的视觉动作特征提取方法,捕捉嘴唇的动态动作和细微变化,准确识别标准发音的唇部动作的细节特征已经对应的文本语义,在降维的基础上增加通道数量,捕捉更深刻更细致的唇部视觉信息,为发音矫正提供更为准确的唇部动作指导;本发明通过语义特征引导对唇部动作的理解与识别,引入多头自注意力机制对语义特征进行优化,捕捉唇部动作与语音文本之间的关联关系,并添加对应的位置编码,使模型理解唇部动作中口语文本发音的顺序,实现更精确的唇部动作指导。
技术关键词
注意力机制 矫正辅助系统 动作特征提取方法 文本 语音识别模块 视觉特征 视频 卷积特征提取 语义特征提取 矫正发音 数据采集模块 代表 音频特征 分析模块
系统为您推荐了相关专利信息
1
基于预训练模型的机电产品设计认知方案生成方法及系统
预训练语言模型 机电产品设计 预训练模型 文本 参数识别模型
2
一种基于多模态融合的结构变异过滤方法、装置及设备
位点 生成结构 带标签 图片 文本
3
一种基于亲和力预测的小分子配体药物筛选方法及系统
药物筛选方法 配体 亲和力 矩阵 变换特征
4
面向域外说话人适应场景的多层级解耦个性化语音合成方法及系统
个性化语音 文本特征向量 编码器 音色特征 音频
5
一种主题音乐生成方法、模型训练方法、装置及存储介质
音乐生成方法 主题特征 条件对抗网络 生成模型训练方法 交叉注意力机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号