教学互动抢答定位方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202510111911

申请日期：2025-01-24

公开号：CN119559972B

公开日期：2025-04-18

类型：发明专利

摘要

本发明属于人工智能领域，涉及教学互动抢答定位方法、装置、计算机设备及存储介质，所述方法包括：获取视频帧序列的集合以及对应的混合音频文件；识别视频帧序列的集合中的关键帧，进行特征提取，并对混合音频进行短时傅里叶变换，再对音频进行特征提取；进行多模态融合生成频谱掩码；计算连续视频帧的动量信息并生成动量嵌入，根据频谱掩码进行频谱嵌入处理；输入动量感知Transformer模块，生成序列信息；进行残差融合，生成频谱掩码；生成可视化声源定位图。多模态融合提升定位准确性，动量嵌入与频谱嵌入增强时序敏感性，残差融合优化特征整合，可视化声源定位图增强直观性，增强学习的互动性和趣味性，有助于提升教学效率与质量。

技术关键词

定位方法短时傅里叶变换关键帧计算机可读指令教学多模态视频帧特征识别视频帧序列计算机设备融合策略音频特征可读存储介质特征提取模块生成特征处理器

系统为您推荐了相关专利信息

一种基于数据清洗的快速定位方法及系统

快速定位方法计算中心终端可信机构画像

基于多模态内容识别的信息审核系统及方法

信息审核系统注意力机制文本视觉识别图像内容

基于AI工作流的个性化学习推荐方法及装置、电子设备

个性化学习推荐方法教学平台机器学习算法知识点生理反应

一种基于多轮红队攻击的大模型安全对齐方法及装置

对齐方法数据计算机可读指令对齐设备策略性

面向动态交通分配的交通需求预测方法及系统

动态交通分配交通需求预测方法交通视频数据关键帧全局特征提取

教学互动抢答定位方法、装置、计算机设备及存储介质

站点导航

APP 下载