摘要
本发明涉及人工智能与计算机视觉交叉技术领域,公开了一种融合大语言模型的知识导图式视频摘要方法与系统,通过对视频的音频撰写文本进行上下文增强,形成“已知知识+视频内容”的增强大模型输入,提升了专业术语准确率,提高关键信息覆盖率。并且将文本摘要生成可视化导图,更便于用户理解和使用,该可视化导图融合了已知关联知识和该视频的摘要的相关知识,提高了导图与视频的相关度。在笔记相关性、知识结构化程度和处理效率三个维度均实现了显著提升,为视频内容的高效学习和知识管理提供了新的技术范式。
技术关键词
文本
视频摘要方法
音频
大语言模型
生成视频摘要
计算机视觉交叉技术
关键点
关键帧
视频摘要系统
压缩算法
标识符
模块
词语
覆盖率
处理单元
模板
数据
分词