一种实时流式语音智能问答服务系统的构建方法

AITNT
正文
推荐专利
一种实时流式语音智能问答服务系统的构建方法
申请号:CN202510220327
申请日期:2025-02-27
公开号:CN119719438B
公开日期:2025-06-10
类型:发明专利
摘要
本申请公开了一种实时流式语音智能问答服务系统的构建方法,包括:接收输入的语音数据;调用独立的语音识别服务将语音数据转换为输入文本;基于输入文本构建大语言模型的提示语,向独立的大语言模型服务发起LLM流式请求,实时获取LLM生成的流式文本回答;通过动态句子切分器对流式文本回答进行实时切分,生成多个子句;对每个子句并行调用独立的语音合成服务,将文本转换为音频数据块;将所述音频数据块按生成顺序组合为流式音频数据,实时返回至客户端播放。本发明通过解耦ASR、LLM与TTS服务,结合异步流式框架与“边想边说”策略,显著提升了语音问答系统的实时性与灵活性。
技术关键词
音频 队列 文本 语音识别服务 数据 服务系统 客户端 语音问答系统 业务场景构建 大语言模型 标识符 生成技术 动态 框架 语义 变量 策略 接口
系统为您推荐了相关专利信息
1
一种智慧泵站的控制系统及方法
灌溉用水量 设备运行信息 智慧泵站 人工智能模型 水泵
2
一种煤炭中的元素碳含量预测方法及系统
元素 煤炭 指标 样本 相关系数阈值
3
领域大语言模型微调训练方法、装置、电子设备及介质
注意力 大语言模型 索引表 数据 列表
4
内容推荐方法、模型训练方法、装置、电子设备及介质
多任务学习模型 预测点击率 样本 加权特征 网络
5
一种遥感影像多源异构数据融合处理方法及系统
多源异构数据融合 局部特征信息 遥感影像数据 图像局部特征 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号