摘要
本申请公开了一种基于多模态牙齿问题咨询的应答方法及装置,属于计算机技术领域。该方法包括:获取用户咨询牙齿健康问题时发送的问询数据,问询数据包括牙齿图像和问题文本;对牙齿图像进行特征提取,得到初始图像特征;基于交叉注意力机制对初始图像特征进行特征强化处理,得到目标图像特征;对问题文本进行特征提取,得到目标文本特征;融合目标图像特征和目标文本特征得到综合特征,将综合特征输入至训练好的大语言模型,得到牙齿健康问题的应答。本申请方法,面向牙齿正畸领域,运用多模态数据处理技术,对用户提供的牙齿图像和问询文本信息进行综合分析,提高了自动应答牙齿健康问题的准确性和适应性。
技术关键词
牙齿健康
交叉注意力机制
文本
大语言模型
多模态
计算机设备
问答知识库
图像特征提取
图像编码器
应答装置
可读存储介质
样本
特征提取模块
数据处理技术
申请方法
视频
非线性