基于视频大语言模型的手术视频分析方法及相关设备

正文

推荐专利

申请号：CN202411494983

申请日期：2024-10-24

公开号：CN119621881B

公开日期：2025-12-16

类型：发明专利

摘要

一种基于视频大语言模型的手术视频分析方法及相关设备，涉及人工智能技术领域。其中方法包括：获取手术视频，以及所述手术视频对应的文本问题；将所述手术视频和所述文本问题输入至视频大语言模型，获取所述视频大语言模型输出的所述手术视频中视频片段对应的文本回答。实施本发明提供的技术方案，可以提高手术视频作为教学和参考资源的实用价值。

技术关键词

大语言模型视频分析方法文本手术语言模块样本视频编码器编码模块令牌文字特征非暂态计算机可读存储介质处理器人工智能技术分类器计算机程序产品输出特征存储器

系统为您推荐了相关专利信息

基于波前像差分析的准分子激光屈光手术实时评估方法

屈光手术波前像差数据角膜特征提取网络空间特征提取

应答方法、装置、电子设备和存储介质

文本对象场景模式社交

基于多模态手术影像融合的术中风险评估系统

风险评估系统序列多模态像素点动态时间规整

远程主机的管理方法、管理装置和远程主机系统

网页元素服务端客户端指令管理方法

基于多轮问答的临床试验资格标准中实体关系自动抽取方法和系统

文本 CRF模型模板实体关系抽取答案

基于视频大语言模型的手术视频分析方法及相关设备

站点导航

APP 下载