摘要
本发明提供了一种基于数字人系统的软件控制方法、系统、设备和介质,涉及人工智能技术领域,包括:获取用户输入的多模态输入信息;将所述多模态输入信息发送至大语言模型中,获取所述大语言模型反馈的关键词信息和操作信息;根据所述关键词信息中的第三方软件信息,控制所述第三方软件执行所述操作信息,并生成输出文字信息;将所述输出文字信息输入至语音合成模块,得到输出语音;基于所述输出语音,控制所述数字人系统模拟的数字人对所述输出语音进行播放。本发明实施例的技术方案能够实现数字人系统对第三方软件的控制,提高数字人的使用便捷性,丰富了数字人的应用场景,增强了用户的互动体验。
技术关键词
大语言模型
软件控制方法
计算机可执行指令
关键词
多模态
机器学习算法
语音唤醒模块
身份
处理器
可读存储介质
黑白名单
人工智能技术
模拟模型
存储器
控制模块
电子设备