摘要
本发明公开了一种基于大语言模型的多语言通用词性识别方法及系统,涉及自然语言处理与词性识别的技术领域,包括:采用大语言模型作为核心基座模型,通过低秩适配技术进行高效微调,设计语言和多领域的词汇与句法分析,使用模型蒸馏将大模型的知识迁移到一个小模型,以减少模型大小和计算成本,通过设计规范化的提示词引导模型生成标准化的输出,并从中自动完成词性识别任务,最后用代码解析模型输出生成JSON格式数据,以供后续的业务系统的集成使用,确保高效支持前端展示和后端业务逻辑处理。本发明输出的词性信息可用于多种下游任务,如智能搜索、文本分类、代码解析和语法校验,为多种业务系统提供数据支持。
技术关键词
大语言模型
识别方法
JSON格式数据
句法依存关系
文本
业务系统
多语言
词性信息
蒸馏
噪声数据
词语
识别系统
自然语言
识别模块
逻辑
标签
分词
系统为您推荐了相关专利信息
大语言模型
交叉注意力机制
变量
风电功率预测方法
气候
医患交互系统
生成动态二维码
报告
安全监控模块
可视化界面