一种基于大模型和RAG的数字人实时交互方法

正文

推荐专利

申请号：CN202510013257

申请日期：2025-01-06

公开号：CN119990309A

公开日期：2025-05-13

类型：发明专利

摘要

本发明涉及数字人交互技术领域，公开了一种基于大模型和RAG的数字人实时交互方法，通过基于ASR模型解析用户输入的语音语义，并将解析结果输入至RAG模块中，通过RAG模块从知识库中检索与用户指令语义相关的数据段，再通过大模型生成回答文本，提高了回答文本的精准性和上下文的相关性。此外，本发明的知识库还支持业务场景化配置，以及在大模型的推理过程中，还基于包括用户输入的语音特征、手势信息的多模态向量进行回答文本的推理，满足了复杂业务场景中对语义理解和多模态交互的更高要求。

技术关键词

语义向量交互方法多层注意力机制文本语音特征指令物联网设备数据逻辑索引企业内部数据动态更新场景上下文自动语音识别推理架构节点语音同步

系统为您推荐了相关专利信息

一种基于深度神经网络的银行审计方法和系统

账户交易特征异常数据审计方法聚类

一种语音生成方法、装置、产品、设备及介质

语音生成方法语音生成模型邻域文本语音生成技术

基于交互控制的文本到图像生成方法、系统、设备及介质

图像生成模型文本图像生成方法生成噪声噪声图像

集群系统的故障定位方法、装置、设备、存储介质及产品

集群系统故障定位方法快照日志指标

一种基于大语言模型的医学影像报告辅助生成方法及装置

大语言模型辅助生成方法报告影像数据

一种基于大模型和RAG的数字人实时交互方法

站点导航

APP 下载