一种基于大模型Word文档段落比较相似度的实现方法及系统

正文

推荐专利

申请号：CN202510992033

申请日期：2025-07-18

公开号：CN120874805A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，具体为一种基于大模型Word文档段落比较相似度的实现方法及系统，包括以下步骤：数据预处理，文档向量化，相似度计算；有益效果为：通过引入预训练的大模型，该方法能够更深入地理解文本内容，捕捉文本的深层语义信息，从而更准确地衡量段落间的语义相似性。这相较于传统基于关键词匹配或表面特征的方法，在复杂语义环境下的表现更为优越。

技术关键词

度度量方法中文分词工具大规模文本数据自然语言停用词表交叉验证方法度计算方法字符编辑文本段落中文文本阶段浮点数语义环境系列模块

系统为您推荐了相关专利信息

提示信息的压缩方法、装置、电子设备及存储介质

大语言模型样本应用程序编程接口语义人工智能模型

基于语音对话的生成式BI的方法、设备及存储介质

关系型数据库可视化图表语音识别模型自然语言滤波器系数更新

一种基于大数据分析的金融风控系统

金融风控系统金融风险防控子模块粒子群算法文本

一种基于知识图谱的课程重构方法及系统

知识点个性化学习路径重构方法图谱学生

一种基于AI的可视化检索方法及系统

可视化检索方法画像标签多模态数据库识别用户角色

一种基于大模型Word文档段落比较相似度的实现方法及系统

站点导航

APP 下载