一种基于大语言模型的多语言通用词性识别方法及系统

正文

推荐专利

申请号：CN202411932124

申请日期：2024-12-26

公开号：CN120012771A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于大语言模型的多语言通用词性识别方法及系统，涉及自然语言处理与词性识别的技术领域，包括：采用大语言模型作为核心基座模型，通过低秩适配技术进行高效微调，设计语言和多领域的词汇与句法分析，使用模型蒸馏将大模型的知识迁移到一个小模型,以减少模型大小和计算成本，通过设计规范化的提示词引导模型生成标准化的输出，并从中自动完成词性识别任务，最后用代码解析模型输出生成JSON格式数据，以供后续的业务系统的集成使用，确保高效支持前端展示和后端业务逻辑处理。本发明输出的词性信息可用于多种下游任务，如智能搜索、文本分类、代码解析和语法校验，为多种业务系统提供数据支持。

技术关键词

大语言模型识别方法 JSON格式数据句法依存关系文本业务系统多语言词性信息蒸馏噪声数据词语识别系统自然语言识别模块逻辑标签分词

系统为您推荐了相关专利信息

一种基于持续学习的公文格式与语义双重校验方法

校验方法文本格式化语义校验算法

大语言模型驱动融合物理预报场的风电功率预测方法

大语言模型交叉注意力机制变量风电功率预测方法气候

一种纪要生成方法、装置、设备、程序产品和存储介质

语义分析算法金融生成方法展示模板处理器

基于离散标签的情感信息识别方法、装置、设备及存储介质

情感信息识别方法标签肢体结构多尺度关节

基于二维码的超声报告智能解读与医患交互系统

医患交互系统生成动态二维码报告安全监控模块可视化界面

一种基于大语言模型的多语言通用词性识别方法及系统

站点导航

APP 下载