摘要
本申请涉及计算机技术领域,公开一种车机服务请求的处理方法、装置、机设备及系统。该方法包括:响应于用户的服务请求,获取车机大屏上显示的屏幕图像;对屏幕图像进行特征元素识别得到至少一个特征元素,并对至少一个特征元素进行检测,得到至少一个文本内容和/或位置信息;构建具有混合特征补充功能的神经网络模型,并将至少一个文本内容和/或位置信息输入至神经网络模型;利用神经网络模型对至少一个文本内容和/或位置信息进行混合特征补充,将补充后的至少一个特征元素经过视觉语言模型处理,得到服务响应,并向用户反馈。本方法利用补充后的特征元素对目标控件进行识别,从而实现更细粒度的识别任务,提高对控件识别的精确度。
技术关键词
神经网络模型
车机控制器
文本
元素
屏幕
图标
视觉
光学字符识别技术
计算机
服务器
图像块
可读存储介质
指令
生成用户
存储器
控件
处理器