一种基于流式增量推理的实时意图识别方法及系统

正文

推荐专利

申请号：CN202511128141

申请日期：2025-08-13

公开号：CN121011177A

公开日期：2025-11-25

类型：发明专利

摘要

本发明涉及语音处理技术领域，具体为一种基于流式增量推理的实时意图识别方法及系统，包括以下步骤：通过语音采集模块接收用户语音输入，并将语音切片成多个音频帧，借助增量大语言模型模块，采用Early‑Exit推理机制，在模型的多个层次设置侧出口，基于QLoRA4‑bit量化技术，对token流进行增量推理利用流式ASR解码模块，使用累计融合模块平滑多个token的预测结果，生成稳定的最终标签；有益效果为：通过将流式ASR解码与增量大语言模型推理结合，能够在每个语音token生成后，立刻对其进行意图识别和风险评估。通过Early‑Exit推理机制，在高置信度条件下，系统能够在推理过程中的中间层即提前输出诈骗意图并停止后续计算，减少了不必要的计算开销。

技术关键词

意图识别方法大语言模型推理机制语音采集模块泄露用户隐私差分隐私技术决策风险评估值解码模块置信度阈值动作模块数据日志合规性音频

系统为您推荐了相关专利信息

科技文档问答方法、装置、存储介质与电子设备

三元组大语言模型答案图谱问答方法

基于知识库的领域智能决策方法和系统

智能决策方法检修策略大语言模型文本注意力机制

一种基于大语言模型的任务拆解与多智能体编排执行系统及方法

大语言模型节点编排执行方法自然语言意图识别

基于大模型和系列超声报告的甲状腺结节结果分析方法

甲状腺超声报告分析方法医学知识库系列医学影像分析技术

三维场景布局方法及系统、存储介质、设备和程序产品

物体布局方法自然语言信息关系三维场景信息

一种基于流式增量推理的实时意图识别方法及系统

站点导航

APP 下载