基于远程监督算法增强大语言模型多标签意图的分类方法

AITNT
正文
推荐专利
基于远程监督算法增强大语言模型多标签意图的分类方法
申请号:CN202411133549
申请日期:2024-08-19
公开号:CN119025679A
公开日期:2024-11-26
类型:发明专利
摘要
本发明提供一种基于远程监督算法增强大语言模型多标签意图的分类方法,获取车机语音埋点数据中的用户输入,对输入文本进行数据清洗并随机选取部分种子样本进行人工预标注,形成种子标注数据集;基于该数据集,利用远程监督算法从中析出规则模板并基于模板对其他未标注样本进行自动标注,扩充标注数据集,得到大语言模型微调训练集;将此训练集按一定格式送入大语言模型微调接口,用LoRA进行微调;构造提示词工程,将当前用户输入填充到提示词预留槽位,形成多标签意图分类提示词;将提示词输入微调后的大语言模型进行推理,输出对应的多标签意图列表。本发明解决了大语言模型微调训练数据获取和标注难度大的问题,实现了车主用车多意图识别功能。
技术关键词
大语言模型 监督算法 多标签 分类方法 关键词 数据 种子 文本 训练集 矩阵 实体 车机 生成随机数 标注规则 意图识别 模板 采样方法 语音
系统为您推荐了相关专利信息
1
一种基于图数据库实现增强检索生成的方法及系统
个性化推荐系统 查询意图 个性化推荐算法 大语言模型 画像
2
基于对抗融合特征和Transformer的矿区土地利用分类方法和系统
土地利用分类方法 交叉注意力机制 特征融合网络 融合特征 数据
3
一种具有杂草生长状态检测功能的选择性除草机器人
状态检测功能 除草机器人 除草装置 线性运动平台 杂草识别装置
4
化工设备隐患识别方法、装置及系统
化工设备 识别方法 人机交互装置 识别装置 特征加权融合
5
基于相邻通道分组的高光谱影像一类分类方法及系统
融合特征 样本 注意力 分类方法 池化特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号