摘要
本发明涉及文本数据分析技术领域,尤其涉及一种面向生成式大模型的文本同源性分析方法,包括以下步骤:S1:对面向生成式大模型的文本数据进行预处理后,将文本数据转化为高维语义嵌入向量,引入混合距离度量进行相似度分析;S2:采用基于密度峰值的动态聚类算法进行动态聚类分析,生成初步的同源文本簇,引入多重迭代映射与动态梯度扰动机制进一步分析,得到优化的同源文本簇;S3:将优化的同源文本簇进行多模态融合,利用图结构对融合后的多模态同源文本簇进行分析,应用时间序列分析方法,得到文本的同源性分析与来源追踪结果,本方法能够有效应对生成式大模型生成文本数据语义表达的多样性和复杂性,增强了文本表示的鲁棒性和准确性。
技术关键词
同源性分析方法
文本
语义
时间序列分析方法
混沌系统
非线性
动态
机制
度量
多模态
数据嵌入
节点
聚类算法
重构
词向量模型
数据分析技术
控制权
关系
高斯核函数
系统为您推荐了相关专利信息
图像
深度特征提取
评价方法
训练深度学习模型
融合特征
地理信息数据
城市道路交通流量
视频流
时空局部特征
深度学习模型
数据构建方法
纠错
预训练语言模型
规则方法
非暂态计算机可读存储介质