一种基于视频理解的交互式问答系统及其工作方法

AITNT
正文
推荐专利
一种基于视频理解的交互式问答系统及其工作方法
申请号:CN202510808458
申请日期:2025-06-17
公开号:CN120653799A
公开日期:2025-09-16
类型:发明专利
摘要
本发明属于人工智能技术领域,具体涉及一种基于视频理解的交互式问答系统及其工作方法。所述前端交互层,用于系统与用户交互互动;所述处理层,用于通过大模型实现基于视频理解的交互式问答;所述知识增强层,知识增强层内的内容以文本形式存储形成知识库,根据用户的问题和视频检索的结果进行二次检索,其检索结果和用户的问题、视频检索片段一起输入多模态大模型中,并生成最终回复;本发明针对无法动态响应用户自由提问、忽略视频画面与音频的语义信息以及缺乏对视频时序上下文的理解能力的问题。
技术关键词
交互式问答 视频分析 数据编码 文本 知识图谱查询 多模态特征融合 视频特征提取 语音特征提取 动态 答案 排序模型 交互内容 人工智能技术 模块 时序 视觉特征
系统为您推荐了相关专利信息
1
一种流程管理方法及装置
策略 计算机程序代码 管理方法 计算机程序产品 计算机存储介质
2
一种基于专家知识优化的软件漏洞检测方法与系统
软件漏洞检测方法 代码特征 文本 切片 语句
3
歌词信息的处理方法及装置、存储介质、电子设备
歌词信息 文本 分词 语义 编辑距离算法
4
通过智能计算中心的算力修改图片的方法及装置
计算中心 图片 多模态 意图 编码
5
基于多级摘要生成的科技项目文档查重方法、设备及介质
文档查重方法 摘要 文本 语义特征提取 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号