面向生成式大模型的文本同源性分析方法

正文

推荐专利

面向生成式大模型的文本同源性分析方法

申请号：CN202510008588

申请日期：2025-01-03

公开号：CN119940368A

公开日期：2025-05-06

类型：发明专利

摘要

本发明涉及文本数据分析技术领域，尤其涉及一种面向生成式大模型的文本同源性分析方法，包括以下步骤：S1：对面向生成式大模型的文本数据进行预处理后，将文本数据转化为高维语义嵌入向量，引入混合距离度量进行相似度分析；S2：采用基于密度峰值的动态聚类算法进行动态聚类分析，生成初步的同源文本簇，引入多重迭代映射与动态梯度扰动机制进一步分析，得到优化的同源文本簇；S3：将优化的同源文本簇进行多模态融合，利用图结构对融合后的多模态同源文本簇进行分析，应用时间序列分析方法，得到文本的同源性分析与来源追踪结果，本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性，增强了文本表示的鲁棒性和准确性。

技术关键词

同源性分析方法文本语义时间序列分析方法混沌系统非线性动态机制度量多模态数据嵌入节点聚类算法重构词向量模型数据分析技术控制权关系高斯核函数

系统为您推荐了相关专利信息

一种基于特征融合的CT图像无参考质量评价方法

图像深度特征提取评价方法训练深度学习模型融合特征

一种城市道路交通流量检测方法及系统

地理信息数据城市道路交通流量视频流时空局部特征深度学习模型

一种基于迭代优化的老挝语语法纠错训练数据构建方法、系统

数据构建方法纠错预训练语言模型规则方法非暂态计算机可读存储介质

药物推荐方法、装置、电子设备及存储介质

药物推荐方法文本数据画像聚类

一种教学视频知识图谱的生成方法和装置、相关产品

视频多模态教学生成方法数据处理模块

面向生成式大模型的文本同源性分析方法

站点导航

APP 下载