一种生成式AI驱动的语音点单与咖啡图案生成方法及系统

正文

推荐专利

申请号：CN202511029219

申请日期：2025-07-25

公开号：CN120977315A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及人工智能、语音识别与智能终端控制技术领域，提供一种生成式AI驱动的语音点单与咖啡图案生成方法，包括基于触发预设的交互触发条件时，采集原始音频信号进行语音识别获取对应的文本信息进行语义解析，生成结构化语义结果，并根据结构化语义结果生成饮品制作指令和图案生成请求；响应于图案生成请求，通过图像生成模型生成拉花图案；将饮品制作指令和拉花图案下发至咖啡机器人的控制模块，执行饮品制作和图案生成操作，并输出定制饮品。结合多模态感知技术提高语音识别准确性并降低误触发率。通过三层意图映射机制与自然语言处理，转换语义实体为执行参数，并生成符合设备要求的高质量拉花图案。

技术关键词

图案生成方法饮品制作图像生成模型拉花语义实体麦克风阵列咖啡机器人运动特征图案生成系统生成提示词饮品类文本多模态特征语音识别准确性信号

系统为您推荐了相关专利信息

一种超声平面波成像方法及装置

图像生成模型超声平面波成像叠加算法生成对抗网络超声换能器

一种利用建筑物掩码图像生成双时相复杂背景的变化检测图像对方法

建筑物变化检测图像生成模型遥感图像信息计算机视觉交叉技术图像嵌入

一种数据关系挖掘方法和系统及设备

关系挖掘方法图形渲染引擎商业数据处理技术节点生成三维图

基于GAN网络和空间注意力的DSM影像空洞修复方法及系统

空洞修复方法影像归一化模块网络卷积模块

一种人脸一致性多角度镜头视频生成方法、装置

多角度视频生成方法视频生成装置图像生成模型镜头

一种生成式AI驱动的语音点单与咖啡图案生成方法及系统

站点导航

APP 下载