短视频的理解文本生成方法、装置、设备及存储介质

AITNT
正文
推荐专利
短视频的理解文本生成方法、装置、设备及存储介质
申请号:CN202510856291
申请日期:2025-06-23
公开号:CN120766179A
公开日期:2025-10-10
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,可运用于医疗康复领域和金融科技领域,公开了短视频的理解文本生成方法、装置、设备及存储介质,应用于康复训练动作合规性监测场景,或可运用于远程开户身份核验与行为分析场景中,其中方法包括:获取待处理短视频,并对待处理短视频进行预处理,生成预处理后视频帧序列;提取预处理后视频帧序列中的时空特征,得到目标时空特征序列;对目标时空特征序列进行特征增强和特征调制,得到调制后特征序列;对调制后特征序列进行跨模态注意力解码,生成初始描述文本;对初始描述文本进行文本优化处理,生成目标描述文本。本发明提高了短视频的理解文本生成的准确性。
技术关键词
文本生成方法 短视频 长短期记忆网络 序列 视频帧 注意力解码 组合特征向量 跨模态 三维卷积神经网络 文本生成装置 生成特征 噪声抑制器 时序 计算机视觉技术 词嵌入向量 可读存储介质 监测场景
系统为您推荐了相关专利信息
1
一种智能化实时语言同步翻译系统及其终端
语义 知识图谱模型 同步翻译系统 语音信号处理技术 语句
2
文档对比溯源方法、设备及计算机存储介质
文本 溯源方法 计算机存储介质 字符 溯源设备
3
面向多种结构的地基施工用打桩机导向方法及系统
打桩机 导向系统 指数 模拟模型 桩体结构
4
基于EPDCC技术识别多种赖氨酸修饰位点的方法
赖氨酸 卷积神经网络分类 位点 极值 初始聚类中心
5
一种基于网架结构与负荷数据的转供决策方法及系统
决策方法 网架结构 电网拓扑结构 负荷预测模型 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号