摘要
本申请公开一种长文本信息处理方法、装置、计算机设备及存储介质,属于人工智能技术领域。本申请通过对原始文本进行语义识别,得到文本语义特征;基于文本语义特征,使用大语言模型生成与原始文本相关的问答对;确定问答对在原始文本中的嵌入位置,并基于嵌入位置对原始文本和问答对进行文本组合,生成初始长文本;组合初始长文本和问答对,构建长文本问答数据集;使用长文本问答数据集对大语言模型进行长文本生成训练,得到长文本生成模型;获取用户输入的待处理文本,使用长文本生成模型中,得到长文本生成结果。本申请还涉及区块链技术领域,待处理文本存储在区块链网络中。本申请降低了中间信息的丢失风险,提升生成文本的准确性和完整性。
技术关键词
文本信息处理方法
文本生成模型
大语言模型
语义特征
文本信息处理装置
语义关键词
计算机可读指令
矩阵
分词
计算机设备
生成指令
数据
模型训练模块
可读存储介质
人工智能技术
区块链技术
组合模块
生成特征
系统为您推荐了相关专利信息
事件检测方法
自然语言
大语言模型
金融
融合策略
设备状态监控方法
环保公厕
语义特征
时序特征
嵌入特征