摘要
本发明提供一种基于远程监督算法增强大语言模型多标签意图的分类方法,获取车机语音埋点数据中的用户输入,对输入文本进行数据清洗并随机选取部分种子样本进行人工预标注,形成种子标注数据集;基于该数据集,利用远程监督算法从中析出规则模板并基于模板对其他未标注样本进行自动标注,扩充标注数据集,得到大语言模型微调训练集;将此训练集按一定格式送入大语言模型微调接口,用LoRA进行微调;构造提示词工程,将当前用户输入填充到提示词预留槽位,形成多标签意图分类提示词;将提示词输入微调后的大语言模型进行推理,输出对应的多标签意图列表。本发明解决了大语言模型微调训练数据获取和标注难度大的问题,实现了车主用车多意图识别功能。
技术关键词
大语言模型
监督算法
多标签
分类方法
关键词
数据
种子
文本
训练集
矩阵
实体
车机
生成随机数
标注规则
意图识别
模板
采样方法
语音
系统为您推荐了相关专利信息
个性化推荐系统
查询意图
个性化推荐算法
大语言模型
画像
土地利用分类方法
交叉注意力机制
特征融合网络
融合特征
数据
状态检测功能
除草机器人
除草装置
线性运动平台
杂草识别装置
化工设备
识别方法
人机交互装置
识别装置
特征加权融合