摘要
本发明涉及语音处理技术领域,具体为一种基于流式增量推理的实时意图识别方法及系统,包括以下步骤:通过语音采集模块接收用户语音输入,并将语音切片成多个音频帧,借助增量大语言模型模块,采用Early‑Exit推理机制,在模型的多个层次设置侧出口,基于QLoRA4‑bit量化技术,对token流进行增量推理利用流式ASR解码模块,使用累计融合模块平滑多个token的预测结果,生成稳定的最终标签;有益效果为:通过将流式ASR解码与增量大语言模型推理结合,能够在每个语音token生成后,立刻对其进行意图识别和风险评估。通过Early‑Exit推理机制,在高置信度条件下,系统能够在推理过程中的中间层即提前输出诈骗意图并停止后续计算,减少了不必要的计算开销。
技术关键词
意图识别方法
大语言模型
推理机制
语音采集模块
泄露用户隐私
差分隐私技术
决策
风险评估值
解码模块
置信度阈值
动作模块
数据
日志
合规性
音频
系统为您推荐了相关专利信息
智能决策方法
检修策略
大语言模型
文本
注意力机制
大语言模型
节点
编排执行方法
自然语言
意图识别
甲状腺超声报告
分析方法
医学知识库
系列
医学影像分析技术