基于视觉语言大模型的正畸目标位推理

正文

推荐专利

基于视觉语言大模型的正畸目标位推理

申请号：CN202511035939

申请日期：2025-07-25

公开号：CN120998407A

公开日期：2025-11-21

类型：发明专利

摘要

本申请提供一种计算机执行的基于多模态融合与动态工具调用的正畸目标位生成方法。其特征在于，采集患者主诉文本、多模态影像与口扫三维模型；分别经视觉/网格适配器提取与文本对齐的图像、网格嵌入，并与文本嵌入合并后添加二维旋转位置编码输入视觉语言模型即 VLM。VLM在推理中按标签触发：需要测量则调用领域专家 AI 返回数据至 VLM 继续推理；需要快速排牙则调用算法生成粗略目标位并转为嵌入回馈至 VLM 迭代优化。最终由解码器将矫治计划隐特征还原为目标牙列三维模型的参数矩阵，生成过程至少包含一次基于工具或粗略目标位的校验修正。

技术关键词

多模态影像数据图像嵌入注意力机制三维模型文本高维特征向量全局特征提取适配器视觉网格生成方法特征提取模块空间关系特征多模态数据融合预训练语言模型动态权重分配三维数字模型局部特征提取分块特征

系统为您推荐了相关专利信息

一种伪装迷彩喷涂检测设备

喷涂检测设备喷涂设备检测组件伸缩支撑杆驱动结构

一种基于多目标群智算法与深度学习神经网络的电动船舶电池健康状态估计方法

深度学习神经网络船舶前馈神经网络注意力机制电池

污水厂水质预测及管理运行方法、计算机程序产品及电子产品

水质预测方法工艺控制参数污水厂时间序列模型综合控制策略

一种基于多模态生成式模型的3D打印系统和方法

打印系统多模态微型电脑令牌打印模块

基于医疗字典知识增强的中文电子病历命名实体识别方法

中文电子病历 BiLSTM模型字典综合语义预训练语言模型

基于视觉语言大模型的正畸目标位推理

站点导航

APP 下载