一种基于大语言模型的术语识别方法及系统

正文

推荐专利

一种基于大语言模型的术语识别方法及系统

申请号：CN202411584298

申请日期：2024-11-07

公开号：CN119441483B

公开日期：2025-09-12

类型：发明专利

摘要

本发明提供一种基于大语言模型的术语识别方法及系统，涉及数据存储技术领域，方法包括：获取待识别文本数据；对待识别文本数据进行分词处理；提取分词处理得到的各个分词的分词特征；利用各个分词的分词特征，通过基于术语权重的N‑gram大语言模型，提取各个分词的加权词向量；根据各个分词的加权词向量，通过三层堆叠双向长短期神经网络，计算待识别文本数据属于术语的概率值；判断待识别文本数据属于术语的概率值是否大于预设概率值；若是，将待识别文本数据确定为术语；否则，将待识别文本数据确定为非术语。本发明可以考虑上下文信息，识别复杂的术语，提升术语识别的准确性。

技术关键词

加权词向量术语识别方法分词大语言模型文本三元组计算机可读指令数据存储技术序列识别系统滑动窗口矩阵参数存储器处理器力矩频率

系统为您推荐了相关专利信息

一种基于先验知识和知识连接的知识图谱自动构建方法

大语言模型知识图谱构建模版文章构建知识图谱

一种音频生成方法、装置、设备及其存储介质

音频生成方法声学特征多尺度特征提取情感特征人机交互方式

信息处理方法、装置、非易失性存储介质和计算机设备

大语言模型非易失性存储介质文本信息处理方法实体

文本推荐方法、装置、电子设备和存储介质

功能模块文本推荐方法对象展示界面推荐装置

一种面向专家偏好对齐的配电系统负荷转供策略评价方法

配电系统负荷负荷转供策略评价装置大语言模型评价方法

一种基于大语言模型的术语识别方法及系统

站点导航

APP 下载