基于对比学习的长文本表征加速系统及方法

正文

推荐专利

基于对比学习的长文本表征加速系统及方法

申请号：CN202510666328

申请日期：2025-05-22

公开号：CN120542434A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开的属于自然语言处理技术领域，具体为基于对比学习的长文本表征加速系统及方法，包括：数据预处理模块，用于对输入的长文本进行文本清洗、分词与标注、文本截断与分块的预处理；领域知识融合模块，用于将领域知识融入到文本表征中，以能够对文本中的词汇与领域知识进行映射和关联，丰富文本的语义信息；对比学习模块，用于先对数据进行增强操作，接着通过对比学习模型得到文本表征向量，之后再通过多尺度对比学习机制提升长文本表征的全面性和准确性。本发明通过设置的对比学习模块，具有实现在对比学习过程中，能够使模型聚焦于学习正例对和负例对之间的关系，而非对所有词两两计算关联，降低计算复杂度。

技术关键词

加速系统语义理解模型多尺度命名实体识别匹配模块文本编码器生成知识降维算法分词算法自然语言分块模型压缩缓存机制神经网络模型硬件平台数据

系统为您推荐了相关专利信息

一种分布式二维嵌套阵列及其获取目标方位的算法

阵列嵌套协方差矩阵天线单元方位角

基于多尺度特征提取与FRFT卷积的SAR船舰检测方法

分数阶傅里叶变换多尺度特征提取残差模块检测网络模型采样模块

基于物理辅助多模态Transformer的遥感增强时间序列预测方法

时间序列预测方法时空序列数据遥感图像数据多模态多尺度

一种通用一体化水面图像增强与目标检测系统及方法

生成器网络分支输入多尺度检测识别模块检测器

基于人工智能的心理健康监测方法及系统

心理健康监测方法语义特征基线心理健康监测系统信号处理算法

基于对比学习的长文本表征加速系统及方法

站点导航

APP 下载