一种基于大模型微调的电信业务问答方法、系统和服务器

正文

推荐专利

申请号：CN202411673450

申请日期：2024-11-21

公开号：CN119513266A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种基于大模型微调的电信业务问答方法、系统和服务器，在对客服历史聊天记录数据进行打标形成第一数据集；采集内部电信业务知识库中的问题数据构成第二数据集；通过构建提示文本输入文本模型进行模型数据构建形成第三数据集后，将三个数据集整合清洗成json数据格式的训练数据集，并通过引入低秩矩阵、采用分布式训练对初始大语言模型进行微调训练，得到训练好的大语言模型，最后对用户发送的待回答文本进行问题改写并向量化后与电信业务知识库中向量进行计算，寻找相似度最高的句子并通过重排模型进行相关性评估，将相关性低于设定值的改写语句输入训练好的大语言模型获得对应的答复文本，以提高电信业务问答的效率和准确度。

技术关键词

大语言模型问答方法分布式训练处理器文本线性变换矩阵问答系统初始化方法预训练模型数据格式语句注意力机制深度学习训练算法客服优化器可读存储介质

系统为您推荐了相关专利信息

前端感知设备的布局评价方法、电子设备及存储介质

布局指标评价方法对象场景

一种基于大模型的车辆软件代码生成方法及系统

软件代码生成方法语义特征车辆文本网络安全渗透测试

一种面向算力调度模型训练的数据投毒识别方法及设备

模型更新代表识别方法协方差矩阵节点

联邦学习方法、装置、设备、存储介质及程序产品

异常数据联邦模型联邦学习方法标记样本

一种电子辅助识别屏结构

机械臂组件屏结构夹具组件旋转臂蜗轮蜗杆

一种基于大模型微调的电信业务问答方法、系统和服务器

站点导航

APP 下载