一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型

正文

推荐专利

申请号：CN202411737842

申请日期：2024-11-29

公开号：CN119782459A

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型，包括自定义Tokenizer模块、嵌入层、多层轻量化Transformer块和输出层；所述自定义Tokenizer模块用于将输入语句生成词汇表，并对词汇进行编码形成Token序列；在嵌入层，将所述Token序列映射成嵌入向量，并输入到多层轻量化Transformer块，获取每个Token的语义和上下文关系的加权向量，输入到输出层，输出层生成最终文本输出。能够在低显存设备上完成长文本中文生成式对话模型的训练和推理。与现有技术相比，本发明不仅降低了硬件要求，还提升了中文对话生成任务的效率和适用性。

技术关键词

数据安全序列构建训练集小规模适配器中文文本电力分词机制语句语义模块关系注意力编码算法能源精度

系统为您推荐了相关专利信息

一种冷冻食品的温度监控方法及系统

温度监控方法冷冻食品噪声卡尔曼滤波算法序列

一种面向电力敏感数据流转的异常行为检测方法及系统

序列马尔可夫模型电力信息安全技术电力系统异常事件

一种血管透视图像的投影方法及智能眼镜

投影方法三维重建模型空间图像信息智能眼镜投影装置

图像处理方法、装置、电子设备、介质和程序产品

图像序列数据多尺度特征注意力局部空间特征图像处理方法

一种跨模态伪标签引导的弱监督目标检测方法

样本学生跨模态图像教师

一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型

站点导航

APP 下载