摘要
一种基于视频大语言模型的手术视频分析方法及相关设备,涉及人工智能技术领域。其中方法包括:获取手术视频,以及所述手术视频对应的文本问题;将所述手术视频和所述文本问题输入至视频大语言模型,获取所述视频大语言模型输出的所述手术视频中视频片段对应的文本回答。实施本发明提供的技术方案,可以提高手术视频作为教学和参考资源的实用价值。
技术关键词
大语言模型
视频分析方法
文本
手术
语言模块
样本
视频编码器
编码模块
令牌
文字特征
非暂态计算机可读存储介质
处理器
人工智能技术
分类器
计算机程序产品
输出特征
存储器
系统为您推荐了相关专利信息
屈光手术
波前像差数据
角膜
特征提取网络
空间特征提取