摘要
本申请提供了一种基于多模态输入的AI对话系统,涉及AI智能交互领域,其采用基于人工智能的数据分析技术来分别对用户输入的意图表达图像进行图像语义特征提取和对用户输入的意图表达文本进行文本语义理解,并基于对意图表达图像语义编码特征和意图表达文本语义编码特征进行主成分分析交互融合得到的特征和提示词来智能地生成回复文本。这样,通过对多模态的意图表达数据进行分析,可以使得AI对话系统更准确地理解用户的实际意图,进而提供更准确地回答,有利于提升用户体验。
技术关键词
意图
编码向量
文本
对话系统
编码特征
多模态
语义特征提取
成分分析
图像特征提取
编码模块
特征提取模块
BERT模型
数据分析技术
图像处理器
处理单元
大语言模型
系统为您推荐了相关专利信息
大数据分析方法
图谱
引入注意力机制
煤矿设备
BERT模型
梅尔频率倒谱系数
压缩感知方法
低密度奇偶校验码
匹配追踪算法
多模态
辅助诊断系统
表格
光学字符识别技术
文本
多模态