一种图像描述文本的生成方法及装置

AITNT
正文
推荐专利
一种图像描述文本的生成方法及装置
申请号:CN202411982623
申请日期:2024-12-26
公开号:CN119903845A
公开日期:2025-04-29
类型:发明专利
摘要
本申请提供了一种图像描述文本的生成方法及装置,所述方法包括:获取几何问题的题目文本和答案文本,以及所述几何问题中的几何图像;将所述几何图像输入预训练的图像描述模型,并获取所述图像描述模型输出的用于描述所述几何图像的原始描述文本;基于所述题目文本和所述答案文本修正所述原始描述文本得到修正后的中间描述文本,并至少根据所述中间描述文本确定用于描述所述几何图像的目标描述文本。
技术关键词
文本 语句 答案 生成方法 图像分析模型 处理器 符号 置信度阈值 指令 计算机程序产品 生成装置 可读存储介质 多模态 处理单元 存储器 电子设备 语义 标记
系统为您推荐了相关专利信息
1
基于多尺度语义知识获取的一体化情感隐喻识别方法、装置、设备和介质
原型 情感类别 识别方法 多尺度特征 文本
2
基于人工智能的信息管理系统及方法
语义关联度 序列 信息管理系统 文本 信息管理方法
3
一种基于人机协作数据调试的人工智能模型优化方法
人工智能模型 概念 人机协作 图像生成模型 归因
4
一种基于代码实体属性相似度的类不平衡处理方法及系统
样本 文本 实体 关系 软件工程技术
5
多模态大模型的校园安防视频巡检预警方法及系统
视频巡检 生成训练样本 预警方法 多模态 训练样本数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号