一种长文本信息处理方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411562254

申请日期：2024-11-01

公开号：CN119670764B

公开日期：2025-10-21

类型：发明专利

摘要

本申请公开一种长文本信息处理方法、装置、计算机设备及存储介质，属于人工智能技术领域。本申请通过对原始文本进行语义识别，得到文本语义特征；基于文本语义特征，使用大语言模型生成与原始文本相关的问答对；确定问答对在原始文本中的嵌入位置，并基于嵌入位置对原始文本和问答对进行文本组合，生成初始长文本；组合初始长文本和问答对，构建长文本问答数据集；使用长文本问答数据集对大语言模型进行长文本生成训练，得到长文本生成模型；获取用户输入的待处理文本，使用长文本生成模型中，得到长文本生成结果。本申请还涉及区块链技术领域，待处理文本存储在区块链网络中。本申请降低了中间信息的丢失风险，提升生成文本的准确性和完整性。

技术关键词

文本信息处理方法文本生成模型大语言模型语义特征文本信息处理装置语义关键词计算机可读指令矩阵分词计算机设备生成指令数据模型训练模块可读存储介质人工智能技术区块链技术组合模块生成特征

系统为您推荐了相关专利信息

基于提示调优与多模型融合的金融文本事件检测方法

事件检测方法自然语言大语言模型金融融合策略

环保公厕设备状态监控方法、装置及设备

设备状态监控方法环保公厕语义特征时序特征嵌入特征

一种多风格迁移数据增强的裂纹检测模型训练评估方法

检测模型训练风格图像分割模型裂纹随机噪声

一种样本增强的方法及装置

大语言模型样本生成提示信息语义种子

一种基于语义slam的辅助割煤方法及装置

采煤设备综采工作面语义特征移动装置点云

一种长文本信息处理方法、装置、计算机设备及存储介质

站点导航

APP 下载