文本生成方法、装置、设备及介质

正文

推荐专利

文本生成方法、装置、设备及介质

申请号：CN202510852161

申请日期：2025-06-20

公开号：CN120764495A

公开日期：2025-10-10

类型：发明专利

摘要

本发明涉及计算机技术领域，公开了一种文本生成方法、装置、设备及介质，包括：获取目标视频，并对所述目标视频中的帧序列进行提取，得到视频图像块表示；通过分层时序网络对所述视频图像块表示进行分析，得到视频时空特征；基于所述目标视频建立语言向量嵌入矩阵，并计算所述视频时空特征与所述语言向量嵌入矩阵的注意力权重矩阵，生成结构化语义表示；通过文本解码网络对所述结构化语义表示进行分析，生成所述目标网络对应的视频文本描述。本申请可应用于金融科技、医疗健康养老等业务程序系统中，能够实现跨模态、多时序条件下的语言生成。

技术关键词

视频时空特征文本生成方法图像块解码网络矩阵语义注意力文本生成装置动作特征业务程序系统预训练模型时序序列分层可读存储介质医疗健康处理器

文本生成方法、装置、设备及介质

站点导航

APP 下载