摘要
本申请公开了一种基于语音识别的纳服辅助方法、装置、设备及介质,涉及人工智能技术领域,包括:通过预设音频滑窗方式从所述预设数据库服务集群中获取通话过程中纳税人和纳服人员各自的音频片段数据,通过第一语音识别服务对拼接音频进行转译;判断主叫转译后拼接文本的文本长度是否超过预设触发阈值,基于判断结果和第一预设智能体触发文本纠错和新问题抽取操作;基于向量知识库对目标问题进行知识索引;在通话结束后,基于第二语音识别服务对满足预设通话时长条件的转译后拼接文本进行文本重组,通过第二预设智能体和问答文本填写话务小结。基于语音识别服务集群和目标大语言模型得到目标问题,能帮助纳服人员快速做答,提升纳服工作效率。
技术关键词
语音识别服务
文本
音频
服务集群
大语言模型
答案
字符
纠错
数据
索引
人工智能技术
滑动窗口
模块
可读存储介质
处理器
电子设备
编辑