一种用于视频字幕生成的上下文语义调制方法及系统

AITNT
正文
推荐专利
一种用于视频字幕生成的上下文语义调制方法及系统
申请号:CN202511273482
申请日期:2025-09-08
公开号:CN120997741A
公开日期:2025-11-21
类型:发明专利
摘要
本发明提供了一种用于视频字幕生成的上下文语义调制方法,属于视频字幕生成领域。为了解决现有上下文语义调制方法中,存在语义对齐效果不佳,且容易忽略关键信息的问题。本发明通过整合每个输出token的上下文信息,进一步学习token间的动态注意力权重,从而实现待生成token与已生成token之间的细粒度语义对齐;该方法不仅能够更有效地建模语义关联,还能自适应地调整关键信息的语义权重,从而增强重要特征的表示,避免关键信息被忽略。
技术关键词
语义 字幕 视频 语句 矩阵 解码器 序列 可读存储介质 调制系统 注意力 文本 输出特征 计算机 编码 处理器 线性 动态
系统为您推荐了相关专利信息
1
基于大模型的语音风格表达切换系统
风格 编码向量 切换系统 跨模态 序列
2
语音交互方法和装置、电子设备及存储介质
词语 语音交互装置 语音交互方法 语句 实体
3
一种电子档案的信息提取方法及提取系统
信息提取方法 数据 文本 命名实体识别 执行错误检测
4
多传感器数据融合的有毒气体浓度检测方法及采集系统
多传感器数据融合 浓度检测方法 有毒气体传感器 卡尔曼滤波算法 协方差矩阵
5
基于边缘计算的公路结构健康监测数据关键信息实时提取方法
健康监测数据 公路结构 无标签数据 缺失值填充方法 标签数据处理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号