摘要
本发明提供一种应用于终端设备的数字人部署方法和系统,通过终端设备采集用户的原始语音数据;将原始语音数据进行预处理并传输至转录模块;通过转录模块将原始语音数据实时转录;将原始语音数据和转录结果发送至语言模型;通过语言模型根据转录结果生成优化结果;通过语音模块将优化结果转换为语音信号并反馈至终端设备;接收语音信号,并根据语音信号对数字人进行动画渲染;驱动数字人输出语音信号。本发明在本地部署终端设备、转录模块、语言模型和语音模块,使用户数据无需上传云端,降低隐私泄露风险,减少系统延迟,提升交互实时性。能够根据用户需求和场景对数字人个性化定制,满足多种应用场景。通过本地化部署的方式能够降低运营成本。
技术关键词
终端设备
语音识别模型
信号
计算机存储介质
动画
数据
输出模块
处理器
计算机设备
存储器
麦克风
场景
服饰
云端
面部
协议
通讯
风险
系统为您推荐了相关专利信息
步态轨迹
下肢外骨骼
采集人体运动
优化预测模型
粒子群优化算法
整车控制功能
测试机柜
整车控制器软件
车辆模型
冗余
协调控制策略
风电机组调频方法
有功功率
频率
储能系统
自动测试系统
人工智能服务器
测试仪器
生成测试用例
数据库服务器
风力发电机组叶片
雷电监测系统
光纤应变传感器
信号处理模块
数据传输模块