基于视频大语言模型的手术视频分析方法及相关设备

AITNT
正文
推荐专利
基于视频大语言模型的手术视频分析方法及相关设备
申请号:CN202411494983
申请日期:2024-10-24
公开号:CN119621881B
公开日期:2025-12-16
类型:发明专利
摘要
一种基于视频大语言模型的手术视频分析方法及相关设备,涉及人工智能技术领域。其中方法包括:获取手术视频,以及所述手术视频对应的文本问题;将所述手术视频和所述文本问题输入至视频大语言模型,获取所述视频大语言模型输出的所述手术视频中视频片段对应的文本回答。实施本发明提供的技术方案,可以提高手术视频作为教学和参考资源的实用价值。
技术关键词
大语言模型 视频分析方法 文本 手术 语言模块 样本 视频编码器 编码模块 令牌 文字特征 非暂态计算机可读存储介质 处理器 人工智能技术 分类器 计算机程序产品 输出特征 存储器
系统为您推荐了相关专利信息
1
基于波前像差分析的准分子激光屈光手术实时评估方法
屈光手术 波前像差数据 角膜 特征提取网络 空间特征提取
2
应答方法、装置、电子设备和存储介质
文本 对象 场景 模式 社交
3
基于多模态手术影像融合的术中风险评估系统
风险评估系统 序列 多模态 像素点 动态时间规整
4
远程主机的管理方法、管理装置和远程主机系统
网页元素 服务端 客户端 指令 管理方法
5
基于多轮问答的临床试验资格标准中实体关系自动抽取方法和系统
文本 CRF模型 模板 实体关系抽取 答案
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号