一种基于连续触控手势的实时语音生成方法及其相关装置

正文

推荐专利

申请号：CN202511002384

申请日期：2025-07-21

公开号：CN120783720A

公开日期：2025-10-14

类型：发明专利

摘要

本申请公开了一种基于连续触控手势的实时语音生成方法及其相关装置，方法包括：采集用户在触控设备上执行连续手势时产生的数据点序列，数据点序列包括数据点的坐标、时间戳和压力值；从数据点序列中提取静态特征序列和动态特征序列，将数据点序列、静态特征序列和动态特征序列融合得到手势特征向量序列；静态特征序列包括相邻两个数据点之间的坐标差值；动态特征序列包括速度、加速度、压力变化率和/或轨迹曲率；通过生成模型对手势特征向量序列进行处理，生成声学特征序列；通过声码器将声学特征序列合成为音频数据。本申请实现了将连续手势转换为连续的语音流，避免了传统离散输入的延迟和卡顿；不依赖于昂贵的专用硬件，降低了使用门槛。

技术关键词

实时语音手势序列声学特征静态特征生成方法数据存储程序代码触控输入模块动态解码器样本注意力编码器生成系统声码器坐标加速度模型训练模块可读存储介质

一种基于连续触控手势的实时语音生成方法及其相关装置

站点导航

APP 下载