摘要
本发明公开一种区分课堂对话中的身份的方法、装置、设备及存储介质。其中,该方法包括:获取课堂音频文件;调用预置的语音识别模型对所述课堂音频文件进行语音识别,得到所述课堂音频文件中的文本内容;利用训练好的基于深度学习的标点预测模型对所述文本内容进行句子分割,得到语音文本的各个句子;计算得出语音文本的各个句子的声纹分;计算得出语音文本的各个句子的视觉总分;基于所述声纹分和所述视觉总分区分出语音文本的各个句子是属于教师的还是属于学生的。本发明能简单方便有效地区分课堂对话中的身份,填补了区分课堂对话中的身份的方法的技术空白,为之后的课堂分析提供了技术基础。
技术关键词
声纹特征
文本
语音识别模型
视觉
声纹模型
身份
音频
分析模块
无监督聚类分析
语音激活检测
语句
语义
学生
检测教师
大语言模型
处理器
计算机设备
系统为您推荐了相关专利信息
声纹识别系统
声纹识别方法
声纹特征
存储模块
音频
融合特征
医学图像数据
图像编码器
患者
文本编码器
清洁方法
脏污
光伏发电量
构建预测模型
光伏组件图像
电焊机械
视觉识别系统
传感器组件
规划
智能控制系统