一种大语言模型驱动的无人机图像语义传输与问答系统和方法

AITNT
正文
推荐专利
一种大语言模型驱动的无人机图像语义传输与问答系统和方法
申请号:CN202510011196
申请日期:2025-01-03
公开号:CN120087484A
公开日期:2025-06-03
类型:发明专利
摘要
本发明公开了一种大语言模型驱动的无人机图像语义传输与问答系统和方法,图像语义提取和量化模块利用语义编码器对无人机捕获的原始图像进行语义特征提取,再通过码本机制离散化特征向量,用于无线信道传输。图像重建模块根据接收到的离散向量对应收发端共享的码本从语义层面恢复传输图像。图像字幕生成模块将图像重建模块恢复的图像作为输入,利用BLIP字幕生成系统生成文本描述信息。提示词生成模块根据用户任务描述和图像字幕生成模块输出文本描述信息生成一段提示词。大语言模型问答模块根据提示词输出自然语言响应指导无人机下一步行动。本发明提升低信噪比条件下无线图像传输的鲁棒性和效率,并且提高问答系统的可解释性,具有一定的实用价值。
技术关键词
大语言模型 问答系统 无人机 字幕 图像语义提取 图像重建 解码器 模块 文本 重构原始图像 视觉特征 索引 感知损失函数 上采样 信道 语言编码器 自然语言理解
系统为您推荐了相关专利信息
1
一种样本数据生成方法及电子设备
大语言模型 答案 生成参数 样本数据生成方法 关联关系分析
2
一种基于Al智能算法的管道巡护系统
巡护系统 环境图像信息 油气 智能算法 管道机器人
3
医疗器械数字化供应链AI智能数据分析的方法和装置
模板 文本 语音播报功能 生成提示词 大语言模型
4
一种基于混合策略的大模型领域安全增强方法及系统
预训练语言模型 语义 拼音 节点 文本
5
桥墩表面裂缝三维分布图生成方法、装置及设备
桥墩表面 裂缝 图像拍摄设备 版图 生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号