摘要
本公开涉及一种基于人工智能的视频质量评价方法、装置、电子设备和可读存储介质,该方法包括:获取待评价视频和待评价视频对应的生成视频文本,生成视频文本包括用于描述待评价视频中至少一个要素的自然语言,要素包括场景、动作、物体变化状态、事件顺序;通过视觉语言模型对待评价视频进行结构化解析,生成视频描述文本;通过大语言模型判断生成视频文本与视频描述文本的语义一致性,根据判断结果生成待评价视频的质量评价结果。
技术关键词
视频
文本
大语言模型
视觉特征
评价方法
自然语言
上存储计算机程序
电子设备
可读存储介质
评价装置
语义
物体
场景
动态
处理器
多视角
校准
存储器
系统为您推荐了相关专利信息
智能问答方法
门控循环单元
命名实体识别模型
答案
度度量方法
数据挖掘模型
数据分析方法
会议
话题
计算机可执行指令
大语言模型
问答方法
答案
可读存储介质
问答装置