基于拐点流的发声动作时序定位方法及系统

AITNT
正文
推荐专利
基于拐点流的发声动作时序定位方法及系统
申请号:CN202510067040
申请日期:2025-01-16
公开号:CN120047866B
公开日期:2025-12-02
类型:发明专利
摘要
本发明公开了一种基于拐点流的发声动作时序定位方法及系统,首先读取包含发声动作的无声视频;然后根据运动学定律进行拐点流分析得到双向运动流和双向拐点流;随后进行特征提取得到图像上下文特征、双向运动特征和双向速度拐点特征;接着计算图像到运动和图像到拐点的跨运动学特征拼接得到跨运动学聚合特征;同时从跨运动学聚合特征中获取判别图,在判别图上对运动区域及非运动区域进行跨视频对比学习并进行视频内部平滑约束,得到激活运动区域特征;最后进行时空特征融合并逐帧进行分类预测,识别每一图像帧是否为发声动作帧。本发明实现了帧级别的碰撞发声动作帧定位,能够准确识别碰撞发声动作对应的视频帧。
技术关键词
双向运动 运动学特征 上下文特征 图像 定位方法 发声 视频 光流估计算法 时序 特征提取模块 时空融合特征 注意力 分析模块 速度 标签技术 编码 定位系统 平滑度
系统为您推荐了相关专利信息
1
路径规划方法、装置、设备、存储介质及产品
路径规划方法 特征选择 激光雷达数据 门阀 路径规划装置
2
一种基于AI大模型的图像清晰度提升方法、装置及介质
分块 像素点 卷积神经网络学习 卷积神经网络提取 关系
3
一种考虑涉鸟故障特性的杆塔间隙绝缘优化设计方法及系统
绝缘优化设计 仿真模型 杆塔 装甲 风险
4
基于数据标注规则的大模型标注方法
标注规则 标注方法 数据 音频 采样率
5
一种烹饪提示方法、装置、设备和存储介质
烹饪提示方法 融合特征 台面 分类网络 烹饪食材
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号