基于语义感知的开放场景英语语音评估方法及系统

AITNT
正文
推荐专利
基于语义感知的开放场景英语语音评估方法及系统
申请号:CN202511299384
申请日期:2025-09-12
公开号:CN120823828B
公开日期:2025-11-28
类型:发明专利
摘要
本发明公开基于语义感知的开放场景英语语音评估方法及系统,涉及语音评估技术领域,对音频数据进行特征提取,得到帧级声学特征;对音频数据进行识别得到转录文本,将转录文本和音频数据对应的主题文本输入语言模型进行处理,得到转录文本的单词级表示和主题文本的单词级表示,进而得到相应的语句级文本表示,计算转录文本和主题文本的语句级文本表示的相似度得到相关性分数;将声学特征和转录文本的单词级表示输入多层Transformer解码器进行特征融合,得到单词级发音表示,进而得到语义感知分数;基于相关性分数和语义感知分数,得到评测结果。通过深度学习模型,提取声学特征与语言特征,进行语义感知融合,实现对开放场景英语语音的精准评估。
技术关键词
语音评估方法 文本 特征提取模块 声学特征 语义 语句 英语 主题 音频 场景 语音评估系统 端点检测技术 发音 解码器 数据 掩码技术 深度学习模型 预训练模型 分支
系统为您推荐了相关专利信息
1
微阵列芯片图像的识别方法和系统
微阵列芯片 图像块 识别方法 语义分割模型 语义分割网络
2
一种局放异常的检测方法及系统
地电波信号 超声波 电信号 数据处理单元 高压开关柜
3
控制车辆驶出停车场的方法、系统、电子设备和存储介质
字符识别模型 控制闸机开启 移动终端 车辆 图像
4
视频评估模型训练的方法、视频评估的方法、装置、计算机设备和存储介质
分箱 视频 样本 工作特征 计算机设备
5
一种环保领域文本词向量化方法及相关系统
文本 跨模态 列表 优化训练方法 Sigmoid函数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号