摘要
本发明公开了一种面向触觉常识推理的触觉‑语言大模型建模方法,包括:S1,准备第一数据集和第二数据集;S2,构建触觉‑语言大模型:触觉‑语言大模型包括:触觉编码器、触觉‑语言适配器和大语言模型LLM;S3,对触觉‑语言大模型进行两阶段训练,在第一训练阶段,采用第一数据集对触觉‑语言大模型进行训练;在第二训练阶段,采用第二数据集对第一训练阶段后的触觉‑语言大模型进行训练,得到训练完毕的触觉‑语言大模型;S4,在测试阶段,将第二数据集输入到训练完毕的触觉‑语言大模型中得到文本描述。本发明的触觉‑语言大模型建模方法,降低了参数耦合风险,实现了高效收敛与跨模态表征的稳健融合,显著提升了训练稳定性。
技术关键词
模型建模方法
前馈神经网络
归一化模块
大语言模型
嵌入特征
拼接模块
文本
数据
编码器
路由器
适配器
标记
语义
序列
时序
视频
注意力机制
两阶段
系统为您推荐了相关专利信息
肝脏血管分割
注意力机制
医学CT图像
前馈神经网络
图像块
文本提取方法
大语言模型
重构策略
干扰特征
识别策略