基于多模态大语言模型以及提示词工程的数据集自构建方法

正文

推荐专利

申请号：CN202510813010

申请日期：2025-06-18

公开号：CN120849942A

公开日期：2025-10-28

类型：发明专利

摘要

本发明提供一种基于多模态大语言模型的数据集自构建方法，属于机器人技术领域。本发明针对家庭服务机器人领域中传统数据集在多模态关联、动态场景建模与时序约束等方面的不足，设计了结构化的Prompt框架，通过结合语言‑视觉特征对齐技术与层次化任务分解策略，实现了用户自然语言指令到机器人执行动作的可靠映射，构建了面向真实家庭复杂场景的数据集数据集。并且，本发明通过建立时空约束模型并设计了双层验证机制，有效提升了多模态大语言模型生成动作序列的执行合理性和任务连贯性。

技术关键词

家庭服务机器人大语言模型多模态视觉特征文本编码器验证机制语义融合特征节点末端执行器仿真平台注意力机制图像场景数据输入结构线性时序逻辑

系统为您推荐了相关专利信息

一种基于自监督多模态融合的医学图像配准方法

医学图像配准方法超分辨率重建模型冠状图像超分辨率重建多模态

基于多模态深度学习的晶圆混合型缺陷检测方法和系统

多模态深度学习缺陷检测方法深度学习网络联合损失函数分支

基于多模态的视频广告的生成方法、系统、设备及介质

视频素材数据生成方法音频生成产品多模态

一种基于倾斜摄影的违建监测方法及装置

违建监测方法多模态数据采集特征提取模块建筑图像数据分析模块

基于无人装备侧GRU+BLR算法锂电池寿命预测方法

门控循环单元分类特征线性回归模型数据锂电池寿命预测

基于多模态大语言模型以及提示词工程的数据集自构建方法

站点导航

APP 下载