基于对比学习的长文本表征加速系统及方法

AITNT
正文
推荐专利
基于对比学习的长文本表征加速系统及方法
申请号:CN202510666328
申请日期:2025-05-22
公开号:CN120542434A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开的属于自然语言处理技术领域,具体为基于对比学习的长文本表征加速系统及方法,包括:数据预处理模块,用于对输入的长文本进行文本清洗、分词与标注、文本截断与分块的预处理;领域知识融合模块,用于将领域知识融入到文本表征中,以能够对文本中的词汇与领域知识进行映射和关联,丰富文本的语义信息;对比学习模块,用于先对数据进行增强操作,接着通过对比学习模型得到文本表征向量,之后再通过多尺度对比学习机制提升长文本表征的全面性和准确性。本发明通过设置的对比学习模块,具有实现在对比学习过程中,能够使模型聚焦于学习正例对和负例对之间的关系,而非对所有词两两计算关联,降低计算复杂度。
技术关键词
加速系统 语义理解模型 多尺度 命名实体识别 匹配模块 文本编码器 生成知识 降维算法 分词算法 自然语言 分块 模型压缩 缓存机制 神经网络模型 硬件平台 数据
系统为您推荐了相关专利信息
1
一种分布式二维嵌套阵列及其获取目标方位的算法
阵列 嵌套 协方差矩阵 天线单元 方位角
2
基于多尺度特征提取与FRFT卷积的SAR船舰检测方法
分数阶傅里叶变换 多尺度特征提取 残差模块 检测网络模型 采样模块
3
基于物理辅助多模态Transformer的遥感增强时间序列预测方法
时间序列预测方法 时空序列数据 遥感图像数据 多模态 多尺度
4
一种通用一体化水面图像增强与目标检测系统及方法
生成器网络 分支 输入多尺度 检测识别模块 检测器
5
基于人工智能的心理健康监测方法及系统
心理健康监测方法 语义特征 基线 心理健康监测系统 信号处理算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号