摘要
本发明涉及课堂教学分析领域,具体涉及一种基于大语言模型与多模态信息融合的课堂教学分析方法。方案包括:通过ASR模型处理课堂音频,输出N‑best候选列表,其中每个候选列表包含置信度评分及时间对齐信息,通过设定置信度阈值筛选N‑best候选中低置信度列表,仅保留高置信度候选;对N‑best候选列表进行修正,得到修正后的SRT;将修正后的SRT文档分为有效语音转写时段、嘈杂时段和安静时段;对课堂视频进行抽帧并标注教师行为和学生行为,通过标注数据对传统视觉模型和视觉大模型进行训练,然后进行检测,得到师生行为时间段,作为SRT分析的辅助进行多模态数据分析。本发明适用于课堂教学分析。
技术关键词
大语言模型
分析方法
多模态数据分析
教师
课堂场景
学生
课堂教学分析
列表
时间段
视觉
置信度阈值
语音
发言人
标记
图片
视频
音频
自然语言
身份
系统为您推荐了相关专利信息
钢管混凝土拱桥
建筑信息模型技术
综合评价方法
有限元分析模型
适应性分析方法
状态分析方法
协方差矩阵
模型超参数
序列
模拟输电线路
燃气轮机
诊断分析系统
数据采集传感器
时间序列数据库
数据存储系统
风险评估模型
矩阵
中间层
强化学习环境
风险评估方法