基于本地化多任务工作流的实时语音交互数字人智能体

AITNT
正文
推荐专利
基于本地化多任务工作流的实时语音交互数字人智能体
申请号:CN202511200891
申请日期:2025-08-26
公开号:CN120998237A
公开日期:2025-11-21
类型:发明专利
摘要
本发明公开了基于本地化多任务工作流的实时语音交互数字人智能体,包括本地工作系统、线上大模型、本地语音识别系统、多任务机制系统和本地语音播放器;所述本地工作系统包括短期记忆层、意图识别路由、RAG本地知识库、危机识别、情绪图谱和心理报告生成;所述多任务机制系统包括数字人前端通信任务线程、大模型问答任务线程、字幕任务、指令任务和TTS处理任务。本发明通过线上大模型与本地化处理结合的混合架构,有效兼顾实时语音交互性能与心理健康服务效果,打破单一架构的局限。线上语音合成技术保障发音准确、情感自然且响应迅速,本地双通道语音识别配合优化机制,显著提升识别精准度,同时支持语音检测与热词打断,优化交互灵活性。
技术关键词
多任务机制 实时语音 语音识别系统 工作系统 语音播放器 心理健康服务 意图识别 字幕 图谱 交互性 记忆 报告 发音 指令 文本
系统为您推荐了相关专利信息
1
基于高效自注意力机制的语音识别方法及系统
语音识别方法 注意力机制 语音识别模型 大规模语音数据 线性
2
基于AI的手持式服务通话质量监控与智能应答系统
智能应答系统 手持式设备 实时语音 客户 长短期记忆网络
3
智能语义理解及校准的生成式语音识别方法以及系统
智能语义理解 语音识别文本 语音识别方法 校准 生成对抗网络
4
一种多语言的语音翻译方法
语音翻译方法 多语言 低资源语言 神经网络架构 机器翻译技术
5
一种基于内网浏览器的车辆实时语音通话处理方法及系统
实时语音 评估数据信息 车辆 采集车 因子
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号