基于视频姿态捕捉的英语发音评测方法及系统

正文

推荐专利

申请号：CN202510101163

申请日期：2025-01-22

公开号：CN120032668A

公开日期：2025-05-23

类型：发明专利

摘要

本申请公开了基于视频姿态捕捉的英语发音评测方法及系统，涉及语言发音评测分析领域，该方法包括：从学习者发音视频中提取在时间轴对齐的音频帧与视频帧，并提取参考英文文章所对应的参考单词序列；将音频帧序列转化为发音文本序列，结合参考单词序列进行比对以确定相应的发音匹配单词序列，并检测是否存在漏读参考单词；分割以确定对应各个发音匹配单词的多个音视频帧单元；确定各个发音匹配单词相应的单词发音音频评分和单词发音姿态评分；基于各个发音匹配单词的单词发音姿态评分和单词发音音频评分和漏读参考单词的检测结果，确定学习者的英语发音综合评分。由此，融合分析学习者发音的音频帧和视频帧，使评测结果更加精确和全面。

技术关键词

发音动作特征音频特征序列视频帧梅尔频率倒谱系数语音识别模型音视频英语矩阵文章文本卷积特征提取评测方法时序特征注意力机制

系统为您推荐了相关专利信息

基于多模态时间序列数据的房树人测验分析方法及装置

生理特征信息情绪特征分析方法静态特征提取数据

基于聊天提示词的金融数字化营销商机分析方法及系统

多模态对话融合特征信号特征文本非可视化信息

一种矿产资源价格预测方法、装置、设备及存储介质

价格预测模型价格预测方法位置更新门控循环单元序列

一种语音识别方法及相关装置

语音识别方法大语言模型声学特征模版计算机可读指令

一种风功率异常检测与修正方法及装置

搜索优化算法掩码矩阵修正方法风电数据处理技术重构模块

基于视频姿态捕捉的英语发音评测方法及系统

站点导航

APP 下载