基于离线环境搭建AI数字人的方法及系统

正文

推荐专利

基于离线环境搭建AI数字人的方法及系统

申请号：CN202510992045

申请日期：2025-07-18

公开号：CN120892137A

公开日期：2025-11-04

类型：发明专利

摘要

本发明实施例提供了一种基于离线环境搭建AI数字人的方法及系统。该方法首先采用容器化部署的自动语音识别模块识别外部的音频信号转换为文本信息，并通过HTTP接口传输至大语言模型，避免云端API的网络延迟与中断风险；然后基于预编排的离线会话流逻辑解析文本信息为目标文本信息，容器化部署的会话流模块可独立运维，减少模块间故障影响；再利用文本转语音模块将目标文本信息转化为音频文件，并同步利用音频驱动面部动画技术生成对应于音频信号的3D模型数据，消除云端传输导致的音画不同步问题；最后利用本地渲染引擎融合数据，避免依赖云端渲染资源引发的队列拥堵，通过全流程离线部署与本地资源协同显著提升服务可靠性。

技术关键词

自动语音识别 USB声卡大语言模型文本信息传输麦克风阵列采集动画技术信号机器可读程序离线外放设备语言模块搭建模块意图识别音频线渲染资源

系统为您推荐了相关专利信息

一种基于大模型的多智能体交互意图理解与协同控制方法

意图协同控制方法智能体交互环境状态信息大语言模型

基于解释生成和多智能体投票的隐性仇恨语言检测方法

大语言模型网络评论文本标签帖子双层智能

基于知识图谱的水利执法自由裁量权推荐方法

推荐方法水利图谱 OCR文字识别技术语音识别技术

一种动态环境下的多机器人协作方法、系统及电子设备

大语言模型机器人协作方法计划策略分层

基于LIama3和检索增强的手机零售店知识答案生成方法

答案生成方法生成提示词手机文本段落生成答案

基于离线环境搭建AI数字人的方法及系统

站点导航

APP 下载