一种实时流式语音智能问答服务系统的构建方法

正文

推荐专利

申请号：CN202510220327

申请日期：2025-02-27

公开号：CN119719438B

公开日期：2025-06-10

类型：发明专利

摘要

本申请公开了一种实时流式语音智能问答服务系统的构建方法，包括：接收输入的语音数据；调用独立的语音识别服务将语音数据转换为输入文本；基于输入文本构建大语言模型的提示语，向独立的大语言模型服务发起LLM流式请求，实时获取LLM生成的流式文本回答；通过动态句子切分器对流式文本回答进行实时切分，生成多个子句；对每个子句并行调用独立的语音合成服务，将文本转换为音频数据块；将所述音频数据块按生成顺序组合为流式音频数据，实时返回至客户端播放。本发明通过解耦ASR、LLM与TTS服务，结合异步流式框架与“边想边说”策略，显著提升了语音问答系统的实时性与灵活性。

技术关键词

音频队列文本语音识别服务数据服务系统客户端语音问答系统业务场景构建大语言模型标识符生成技术动态框架语义变量策略接口

系统为您推荐了相关专利信息

一种智慧泵站的控制系统及方法

灌溉用水量设备运行信息智慧泵站人工智能模型水泵

一种煤炭中的元素碳含量预测方法及系统

元素煤炭指标样本相关系数阈值

领域大语言模型微调训练方法、装置、电子设备及介质

注意力大语言模型索引表数据列表

内容推荐方法、模型训练方法、装置、电子设备及介质

多任务学习模型预测点击率样本加权特征网络

一种遥感影像多源异构数据融合处理方法及系统

多源异构数据融合局部特征信息遥感影像数据图像局部特征语义

一种实时流式语音智能问答服务系统的构建方法

站点导航

APP 下载