摘要
本申请涉及一种基于大模型的用户界面操作方法、装置、设备和介质。操作方法包括,对用户的多通道交互信息进行融合处理,形成用户交互任务描述;从记忆库中检索获得与所述用户交互任务描述匹配的历史交互经验和外部知识;将所述用户交互任务描述、历史交互经验、外部知识输入提示词生成大模型,生成结构化提示词;将结构化提示词输入大模型,生成能够对用户界面进行操作的结构化操作指令,对用户界面进行操作。本发明综合利用了语音、视觉、手势和触控等多通道感知数据和生成式人工智能,实现对用户交互任务的深度理解与高效执行。
技术关键词
多通道
记忆
信息处理
手势
注意力机制
界面
生成框架
画像
语音
策略
处理器
跨模态
计算机设备
语义
可读存储介质
多模态
指令
模块
关键词
存储器
系统为您推荐了相关专利信息
生物检测试剂盒
分层强化学习
注塑设备
车间调度方法
车间调度系统
视频段
建模方法
图像特征融合识别
数据
双向长短期记忆网络
光伏板故障检测
深度学习网络算法
层级
局部注意力机制
Sigmoid函数
压电薄膜传感器
AD转换模块
数字图像传感器
车辆管理平台
信号调理模块