摘要
本申请公开了一种基于AI数字人互动式博物馆讲解服务的智能问答系统及方法,该系统包括:多模态输入接收单元、用户意图识别模块、垂直领域智能问答单元、数字人答案视频生成模块和人机交互界面模块;多模态输入接收单元,用于采集用户通过语音、文本或手语动作的输入路径所传达的输入信息,并将所采集的用户输入信息发送至用户意图识别模块;用户意图识别单元,通过语音识别、自然语言处理和手语动作识别技术对用户输入信息进行解析和处理,提取出用户意图的文本描述;垂直领域智能问答单元,基于输入的表达用户意图的文本描述,搜索与该文本描述相关的文本回答,对文本回答提炼,获取用户查询相关的文本答案;数字人答案视频生成模块,将文本答案转换为语音和手语动作,通过虚拟数字人的多模态行为实时生成视频。
技术关键词
智能问答系统
文本
博物馆
意图识别
答案
人机交互界面
语音
模块
视频
手势特征
多模态
自然语言
手语识别技术
动作识别技术
智能问答方法
人体姿态识别
手势识别技术
系统为您推荐了相关专利信息
飞机结构损伤
多模态
文本特征向量
图像特征向量
分析方法
文本实体抽取方法
大语言模型
页面
辅助训练数据
微调工具
水电厂设备
监督学习模型
传感器特征
图像特征向量
监督学习技术