一种采用人工智能的视频通讯语音转写方法、装置及电子设备

正文

推荐专利

申请号：CN202511144555

申请日期：2025-08-15

公开号：CN120977306A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种采用人工智能的视频通讯语音转写方法、装置及电子设备，涉及语音转写技术领域，包括以下步骤：获取视频通讯过程中的语音信号并按照预设帧长进行切分，得到若干个语音片段；对若干个语音片段分别进行特征提取，构建模糊特征向量并识别模糊发音区段；采用三角形隶属度函数构建语音隶属度曲线，并对语音隶属度曲线的拐点前后的模糊特征向量变化进行评估；基于评估结果对模糊发音区段对应的语音隶属度曲线斜率进行修正，得到修正后的模糊区间；对动态生成的音素候选路径进行筛选，并基于筛选后的最优音素路径生成文字转写结果，解决了当语义变化量被过度放大时，曲线拐点偏移过大，导致模糊音被强制分配到非主语义路径的问题。

技术关键词

语音转写方法视频通讯隶属度函数生成文字双向长短期记忆网络曲线斜率发音语音采集模块转移概率矩阵语音转写技术三角形噪声抑制算法隐马尔可夫模型生成候选词电子设备分析模块谐波噪声信号

系统为您推荐了相关专利信息

应用于多阶段多层级模糊柔性作业车间的调度方法及装置

柔性作业车间调度子模块隶属度函数多阶段层级

一种基于PLC系统模糊算法的控制方法及装置

PLC系统模糊算法模糊规则库模糊控制规则隶属度函数

一种光引发剂制备过程中的验证系统及其制备工艺

光引发剂验证系统指标决策评价方法色谱分析法

一种功能性电刺激的闭环反馈控制方法

学习控制器闭环反馈控制方法节点模糊PID控制器误差

一种增强模糊超盒神经网络的医学图像识别方法

医学图像识别方法灰度共生矩阵医学图像数据集搜索优化算法医学图像分类

一种采用人工智能的视频通讯语音转写方法、装置及电子设备

站点导航

APP 下载