摘要
本发明公开了一种基于多模态交互的家教问答方法及装置,包括:首先通过采集用户的视频、音频及主动输入数据,对这些多模态数据进行编码处理,生成对应的特征向量。这些向量被输入到一个预先训练并经过教育领域数据微调的多模态大模型中,以获取针对当前问题的执行策略。最后,基于该策略生成针对性的教学答复内容。如此设计,充分利用了多模态信息,提高了家教问答系统的交互性和教学效果。
技术关键词
视频特征向量
数据
音频
多模态交互
教学
检索策略
展示工具
编码
文本
图片
记忆单元
问答方法
调度器
输入解码器
视频帧
分词
系统为您推荐了相关专利信息
建筑供配电系统
半实物仿真
虚拟仿真系统
数据处理系统
数据处理单元
水库优化调度方法
三次样条插值算法
优化运行策略
径流
数据驱动模型
完整性验证方法
内存
验证机制
节点
数据访问效率