基于人工智能辅助谈话场景的语言识别方法及系统

正文

推荐专利

申请号：CN202411892222

申请日期：2024-12-20

公开号：CN119724157A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开了基于人工智能辅助谈话场景的语言识别方法及系统，属于语言识别技术领域，其方法具体包括：利用传感器采集音频信号和视频数据，实时对音频信号和视频数据进行噪声过滤，对噪声过滤后的音频信号进行预处理，对预处理后的音频信号中的语音进行分离，和谈话者进行分割，提取每个谈话者的语音特征，并根据语音特征进行语音解码，输出最终的文本，根据输出最终的文本和语境，分析谈话者的意图；通过摄像头捕捉谈话者的面部表情和肢体语言，并结合语音信号中的音调和情感信息，能够更加全面地理解对话的真实语义。

技术关键词

人工智能辅助语言识别方法语音特征音频意图语言识别系统信号特征提取单元短时傅里叶变换多轮对话文本场景时序注意力机制解码模块语言识别技术静态特征提取数据采集模块

系统为您推荐了相关专利信息

基于机器人的任务执行方法、装置、计算机设备、可读存储介质和程序产品

节点机器人连线关系计算机设备

一种车辆盲区遮挡碰撞预警方法

碰撞预警方法航向角信息转向灯意图车辆行驶安全性

一种基于多模态大模型本地训练的ai agent智能体

多模态数据收集单元语音控制单元预训练模型远程控制单元

人工智能辅助的CT影像质量增强与噪声降低方法

人工智能辅助低剂量CT图像生成对抗网络噪声卷积神经网络模型

基于元宇宙文化产品的数字资产处理方法及系统

数字资产转换分布式存储技术音频制作技术版权动画制作技术

基于人工智能辅助谈话场景的语言识别方法及系统

站点导航

APP 下载