一种基于大语言模型token的文本通用程度评分方法

正文

推荐专利

申请号：CN202410774677

申请日期：2024-06-17

公开号：CN118627503A

公开日期：2024-09-10

类型：发明专利

摘要

本发明公开一种基于大语言模型token的文本通用程度评分方法。开源tokens收集汇总的方式，旨在充分利用现有大模型训练的通用tokens，形成一种判断文本通用程度的计算方法，本专利的创新点主要体现在设计了一种业界尚未实现的技术思路来评估文本通用程度。本专利通过当前业界简单的操作组合，即可实现判断一个文本通用程度评分方法，但是和传统业界的实现思路完全不同，且思路方案至今未被业界所提出，同时计算实现简单，同时本身能力且有实际价值，判断是否当前文本存在知识明显迁移，从而判断是否需要训练大模型。

技术关键词

文本评分方法分词算法大语言模型模型预训练思路计算方法解码代表词典数据字符索引

系统为您推荐了相关专利信息

一种基于个性化知识图谱的个性化学习推荐方法

知识点个性化学习推荐方法个性化知识图谱画像模型文本

用于大语言模型的模型评估方法、装置、介质及设备

模型评估方法评估工作流大语言模型节点指令

一种法律数据嵌入调优的法律条文检索方法及检索效果评估

法律条文检索方法数据嵌入关键词提取方法词嵌入模型大语言模型

基于边缘增强和瓶颈向量的指代图像分割方法及系统

融合视觉特征解码器图像分割方法跨模态瓶颈

基于人工智能面向儿童的文本分级方法及系统

文本 Sigmoid函数多层感知机复杂度特征预训练模型

一种基于大语言模型token的文本通用程度评分方法

站点导航

APP 下载