摘要
本申请涉及语音交互技术领域,尤其涉及一种基于大模型的汽车说明书解析、语音播报及指令控制方法,包括上传汽车说明书文档并对其进行解析,将解析后的所述汽车说明书文档转化为高维向量表示并存储在向量数据库内;响应于用户的查询请求,在所述向量数据库中进行向量检索并生成检索结果;将所述检索结果输入至大语言模型,生成符合符合用户需求的自然语言回答;调用语音合成技术播放所述自然语言回答,识别是否存在车机控制命令,若是不存在则直接播放,若是存在,则响应于用户的反馈判断是否执行所述车机控制命令。本申请能够实现车书信息的自动化整理、精准检索和智能化交互。
技术关键词
指令控制方法
自然语言
车机
表格
文本
命令
图像提取功能
大语言模型
指令控制系统
字符识别技术
语音交互技术
图像分割算法
生成汽车
页面
识别工具
查询意图
格式
系统为您推荐了相关专利信息
聚类
大语言模型
文本生成模型
文本处理方法
噪声
文本检索方法
节点
链表结构
索引技术
计算机可读指令
图像情感分析方法
标签
情感类别
对象识别模型
图像增强
自然语言
模型优化方法
标记
计算机程序产品
语义