一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统

AITNT
正文
推荐专利
一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统
申请号:CN202411114779
申请日期:2024-08-14
公开号:CN119068870B
公开日期:2025-03-25
类型:发明专利
摘要
本发明公开了一种多模态喉部振动信号与唇部动点数据的语音解码识别方法及系统。本发明通过采集发声时的喉部振动信号解码声调与中文四声,采集发声时的唇部动点数据解码声韵母与音节,两者结果进行多模态融合,并将结果送入到大语言模型中,最终大语言模型输出识别文字。相较于传统的面颈部生理信号语音解码方法,本发明语音识别方法,具有适合长期监测,符合语言学的音节构成原理,受语料库影响小,泛化能力强,与单模态无法实现的单字符级别的识别精度与准确度等特点。
技术关键词
振动信号识别 数据识别模型 信号预处理模块 多模态 支持向量机分类 信号采集模块 频域特征提取 识别系统 发声 语音解码方法 大语言模型 语音识别方法 压电传感器 信号放大器
系统为您推荐了相关专利信息
1
基于三维液体二极管的造口底盘、造口检测系统、算法
二极管 监测算法 肠鸣音传感器 微型热电偶 智能检测系统
2
一种基于毫米波雷达的巷道形变监测装置
形变监测装置 动态测量范围 雷达 故障诊断模块 ARIMA模型
3
AI大模型和数据编织的多源异构信息融合与分析方法
融合特征 分析方法 图谱 数据网络 多模态
4
一种风力机叶片声纹识别检测方法
风力机叶片 支持向量机分类器 信号 叶片状态监测 小波分析方法
5
数据与知识协同驱动的认知效度计算模型增强方法及系统
高斯核函数 互动特征 数据 矩阵 教学
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号