一种基于多模态的多语言自定义指令识别方法和系统

正文

推荐专利

申请号：CN202510505944

申请日期：2025-04-22

公开号：CN120690187A

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种基于多模态的多语言自定义指令识别方法和系统，包括：步骤S1：构建多模态大模型并对该模型进行训练，其中，多模态大模型构建支撑输入处理单元、查询输入处理单元和度量判别器；步骤S2：在步骤S1的基础上，注册用户自定义语音指令；其中，通过步骤S1中训练好的支撑输入处理单元获取并存储用户注册指令的支撑特征向量；步骤S3：获取用户语音并利用步骤S2生成的模型进行推理与指令识别；其中，利用上述训练好的查询输入处理单元对用户语音进行处理输出查询向量，并计算与预先存储的支撑特征向量的匹配度，以此识别用户语音指令。本发明基于多模态融合与度量学习框架，实现高效、可扩展的多语言自定义指令识别。

技术关键词

自定义指令处理单元识别方法自定义语音指令音频编码器融合多模态特征数据信息查询功能交叉注意力机制度度量方法归一化模块文本编码器

系统为您推荐了相关专利信息

基于大数据的客户画像分析的风险识别方法及其系统

客户风险识别方法画像金融大数据

用于电动驱动镜管的插入轴

导线锚定点主动冷却系统控制单元电源传输单元

故障诊断报告生成方法以及相关设备

格式模板报告生成方法条目样本界面

一种配电网拓扑结构识别方法、装置、设备及介质

监测终端配电网拓扑结构变压器数学模型功率

一种光学膜配向方向识别方法、装置、系统及存储介质

图像采集装置光学膜识别方法亮度参数

一种基于多模态的多语言自定义指令识别方法和系统

站点导航

APP 下载