基于对话式大语言模型的文本数据构建方法和介质

正文

推荐专利

申请号：CN202510062899

申请日期：2025-01-15

公开号：CN119990070A

公开日期：2025-05-13

类型：发明专利

摘要

本发明公开了基于对话式大语言模型的文本数据构建方法和介质，方法包括包括根据自然语言处理的需求，获取多样式文本数据作为第一数据，第一数据形成第一数据集；对所有第一数据进行预处理以形成第二数据，预处理后的第二数据形成第二数据集；将每个第二数据插入设定好的清洗prompt中，将清洗prompt输入大语言模型，以对第二数据进行指令评估和赋予标签；对标签进行过滤以过滤掉部分第二数据，并形成过滤后的第三数据集；将第三数据集中的第二数据插入设定好的转换prompt中，将转换prompt输入大语言模型，大语言模型将第二数据转换为满足自然语言处理需求的文本数据。无需人工处理，提高了效率、降低了成本，并减少了对专业知识的依赖。

技术关键词

数据构建方法大语言模型文本自然语言标签风格可读存储介质指令程序列表规模计算机处理器

系统为您推荐了相关专利信息

一种基于标签信号指导的多模态情感识别方法

音频特征文本情感识别方法标签多模态情感识别

holo-RBP4的制备方法及其在制备治疗家族性玻璃体淀粉样变性药物中的应用

蛋白质表达 T7RNA聚合酶模型小鼠玻璃体质粒

一种基于AI大语言模型的多模态电力知识库构建方法及检索方法

知识库构建方法视频画面数据图像画面数据文本电力

用于糖尿病并发症多标签预测的特征选择方法

特征选择方法噪声标签矩阵梯度下降算法医疗数据处理技术

高精度定位支撑的高安全性场景驱动决策控制一体化自动驾驶系统

自动驾驶系统数据安全监测智能网联汽车云端平台

基于对话式大语言模型的文本数据构建方法和介质

站点导航

APP 下载