摘要
本申请基于多模态大语言模型的体育视频解说评价方法及系统,包括:获取数据集,所述数据集包括体育解说的视频片段与文本解说所构成的数据对;将所述数据集进行语义分类,确定语义标签,所述语义标签将所述数据对分成以下至少之一:关键事件描述、技术细节分析、背景信息解释、战术分析、比赛情况解释与情感表达;构建多模态大语言模型,调用所述数据集训练所述多模态大语言模型,确定体育视频解说模型;对所述体育视频解说模型进行评分,确定评价结果。本申请通过多维度评估方法能更全面地反映模型在体育解说任务中的表现,克服了传统指标无法捕捉细粒度专业细节、时间动态和人类情感的局限性。
技术关键词
大语言模型
体育
视频
语义标签
文本
多模态
多维度评估方法
语句
评价方法
语义特征
双向注意力
视觉
融合特征
主题
运动员
展示模型
数据获取模块
字符
系统为您推荐了相关专利信息
监控调度方法
混合预测模型
监控调度系统
数据采集模块
客流预测
命名实体识别方法
训练样本集
扩充训练样本
历史数据预处理
标记方法