一种利用大语言模型驱动数字人动作的方法及系统

正文

推荐专利

申请号：CN202411839828

申请日期：2024-12-13

公开号：CN119785427A

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种利用大语言模型驱动数字人动作的方法及系统，方法包括调用大模型识别当前及前续会话内容，预测人物的情绪和动作，输出连贯的情绪和动作标签；根据不同情绪与动作的映射关系，结合深度学习与规则库构建方法，建立涵盖多样行为模式的数字人规则库；根据识别出的当前会话的情绪和动作标签，在数字人规则库中调用绑定的表情和动作渲染逻辑，生成实时会话视频流；实时逐帧播放生成的数字人会话视频流。优点为：能够让数字人更自然的结合会话内容，生成带有表情和动作的视频流，并通过循环执行以达到实时播放数字人对话视频流的效果，减少了传统方法中可能出现的表情动作僵硬或与会话内容不匹配情况。

技术关键词

大语言模型规则库构建方法标签会话量化编码方法多轮对话深度Q学习生成视频流逻辑动作表情加权技术语义平滑方法缓存策略平滑算法播放模块关系刷新率网络结构

系统为您推荐了相关专利信息

一种基于管网水力状态融合数据集的爆管事件定位方法

事件定位方法监测点 LSTM算法供水管事件识别

一种多模态舆情数据智能分类分级方法、装置和设备

多模态数据智能分类大语言模型文本音频

一种基于原型跨图像一致性的半监督语义分割方法

原型注意力语义分割方法网络图像

一种对话机器人学习方法、装置、车辆、介质及产品

大语言模型对话机器人文本编码学习方法

基于四步TOF通信的UWB定位跳变抑制方法

定位标签定位基站信号飞行时间卡尔曼滤波连续性

一种利用大语言模型驱动数字人动作的方法及系统

站点导航

APP 下载