摘要
本发明公开了一种用于能源电力数据安全领域的小规模长文本中文生成式对话模型,包括自定义Tokenizer模块、嵌入层、多层轻量化Transformer块和输出层;所述自定义Tokenizer模块用于将输入语句生成词汇表,并对词汇进行编码形成Token序列;在嵌入层,将所述Token序列映射成嵌入向量,并输入到多层轻量化Transformer块,获取每个Token的语义和上下文关系的加权向量,输入到输出层,输出层生成最终文本输出。能够在低显存设备上完成长文本中文生成式对话模型的训练和推理。与现有技术相比,本发明不仅降低了硬件要求,还提升了中文对话生成任务的效率和适用性。
技术关键词
数据安全
序列
构建训练集
小规模
适配器
中文文本
电力
分词
机制
语句
语义
模块
关系
注意力
编码
算法
能源
精度
系统为您推荐了相关专利信息
温度监控方法
冷冻食品
噪声
卡尔曼滤波算法
序列
序列
马尔可夫模型
电力信息安全技术
电力系统
异常事件
投影方法
三维重建模型
空间图像信息
智能眼镜
投影装置
图像序列数据
多尺度特征
注意力
局部空间特征
图像处理方法