一种用于视频字幕生成的上下文语义调制方法及系统

正文

推荐专利

申请号：CN202511273482

申请日期：2025-09-08

公开号：CN120997741A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供了一种用于视频字幕生成的上下文语义调制方法，属于视频字幕生成领域。为了解决现有上下文语义调制方法中，存在语义对齐效果不佳，且容易忽略关键信息的问题。本发明通过整合每个输出token的上下文信息，进一步学习token间的动态注意力权重，从而实现待生成token与已生成token之间的细粒度语义对齐；该方法不仅能够更有效地建模语义关联，还能自适应地调整关键信息的语义权重，从而增强重要特征的表示，避免关键信息被忽略。

技术关键词

语义字幕视频语句矩阵解码器序列可读存储介质调制系统注意力文本输出特征计算机编码处理器线性动态

系统为您推荐了相关专利信息

基于大模型的语音风格表达切换系统

风格编码向量切换系统跨模态序列

语音交互方法和装置、电子设备及存储介质

词语语音交互装置语音交互方法语句实体

一种电子档案的信息提取方法及提取系统

信息提取方法数据文本命名实体识别执行错误检测

多传感器数据融合的有毒气体浓度检测方法及采集系统

多传感器数据融合浓度检测方法有毒气体传感器卡尔曼滤波算法协方差矩阵

基于边缘计算的公路结构健康监测数据关键信息实时提取方法

健康监测数据公路结构无标签数据缺失值填充方法标签数据处理

一种用于视频字幕生成的上下文语义调制方法及系统

站点导航

APP 下载