一种基于多模态大模型的用户界面自动化断言方法、系统及程序产品

AITNT
正文
推荐专利
一种基于多模态大模型的用户界面自动化断言方法、系统及程序产品
申请号:CN202510429490
申请日期:2025-04-07
公开号:CN120371694A
公开日期:2025-07-25
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的用户界面自动化断言方法、系统及程序产品,应用于UI自动化测试领域。为解决传统断言编写复杂、低效且难以描述视觉预期的问题,本方法包括:获取待测UI的屏幕图像及描述预期状态的文本指令;将图像与文本指令输入至配置为联合处理图文的多模态大模型(MLLM);利用MLLM的图文联合理解能力,分析图像中的实际UI状态是否满足文本指令的预期;基于模型判定结果生成最终断言结果。本发明以MLLM的智能分析替代复杂的断言编码,允许使用自然语言或结构化文本定义预期,显著简化了断言创建,提升了UI测试开发效率与可维护性,并能更灵活准确地验证视觉层面的UI状态。
技术关键词
断言方法 多模态 置信度阈值 图像 屏幕 指令 预定义关键字 自然语言文本 视觉 层级 图文 程序 控件 交互性 语义 标识符 鲁棒性 计算机
系统为您推荐了相关专利信息
1
基于量子混合神经网络的同态图文匹配方法和装置
量子神经网络 量子态 图文匹配方法 文本 同态加密算法
2
一种多光谱图像的输出设备和多光谱图像的输出方法
窄带滤光片 图像传感器 图像处理器 多光谱 窄带滤波
3
基于数字孪生模型的路面坑槽修复材料工程量计算方法
工程量计算方法 数字孪生模型 深度学习模型 路面坑槽识别方法 神经网络单元
4
基于大模型技术的风资源评估报告生成方法
评估报告生成方法 文本 word2vec模型 融合词向量 数据可视化图表
5
一种基于边缘增强采样的机器人手术多源影像融合方法
解剖特征 注意力 机器人手术 编码特征 边缘增强单元
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号