摘要
本发明为一种基于大模型的教学视频理解的方法,所述方法包括如下步骤:1)建立大模型,给大模型进行训练和微调;2)采集视频中的信息,该信息包括图片信息和语音信息;3)将语音信息和图片信息单独处理,语音和图片信息均转换成文字信息;4)分段理解生成;5)摘要生成;6)应用输出结果。本发明能够在复杂的真实教学场景中稳定工作,通过自动化的方式提升课堂视频的使用价值,增强教学质量的监控,并为教学和学习提供精准的辅助。
技术关键词
视频
文字信息处理方法
语音信息处理方法
算法模型
图片
摘要
教学场景
分段
教师
学生
数据
噪声
节点
频率
系统为您推荐了相关专利信息
检测跟踪方法
无人机
跟踪目标丢失
地面站
跟踪目标图像
面部动作单元
编码特征
音频编码
融合特征
多层感知器
五指灵巧手
周围环境数据
机器学习模型
收集周围环境
机器学习算法
视频图像采集系统
插值优化方法
数据转换单元
像素点
图像采集芯片