摘要
本申请提供了基于多模态处理的自动语音工单生成系统及方法,涉及语音工单生成技术领域,该系统包括:多模态输入层,用于采集语音数据、设备元数据和辅助模态数据;语音处理层,用于对语音数据进行音频预处理以提取音频特征信息,转写为文本信息;语义解析层,用于接收设备元数据和辅助模态数据,以及音频特征信息和转写文本信息,结合历史工单数据进行多模态领域自适应解析;工单输出层,用于接收结构化工单要素后,转换为标准化工单。通过本申请可以解决现有技术中由于人工干预依赖高且多模态数据处理割裂,导致语音识别准确性低,进一步影响工单生成效率的技术问题,通过实现语音数据到结构化工单的端到端自动化转换,提高了工单生成效率。
技术关键词
多模态
音频特征信息
生成系统
历史工单数据
文本
工单生成方法
化工
环形缓冲区
IP电话
工单生成技术
识别模块
语音识别准确性
队列调度机制
语义
双缓冲机制
RTP协议
场景
系统为您推荐了相关专利信息
语义实体
继电保护定值单
电力系统继电保护
信息抽取方法
分区
沉淀池
抗干扰监测系统
监测算法
监测方法
泥位计
融合特征
多模态数据采集
数据安全管理
跨模态数据
农业
文本内容特征
超文本标记语言
告警方法
归因
皮尔逊相关系数
S型曲线函数
身份
统一社会信用代码
年龄
语义向量