序列级对齐方法及其多模态检索方法

正文

推荐专利

序列级对齐方法及其多模态检索方法

申请号：CN202510802341

申请日期：2025-06-16

公开号：CN120873233A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及序列级对齐方法及其多模态检索方法。通过序列级对比学习机制，能够有效地捕捉模态间的局部对齐关系，获取跨模态的关键信息，使对齐精度得以显著提高，放大了细粒度对齐对提升检索、匹配、识别等任务的重要性，显著提高了执行这些任务时的精度。将音频模态引入多模态运动检索框架，结合文本、视频和运动模态，实现了更自然、直观的用户交互。通过扩展现有的文本‑动作数据集，在此基础上扩充了音频模态，为音频驱动的运动检索任务提供了数据支持。此外，还专门生成了口语化文本和音频。这不仅填补了空白，还为未来的研究和应用奠定了数据基础。

技术关键词

序列对齐方法多模态检索方法矩阵数据音频样本度量文本跨模态视频运动精度参数机制框架基础关系

序列级对齐方法及其多模态检索方法

站点导航

APP 下载