一种结合大语言模型挖掘专利信息的处理方法和装置

AITNT
正文
推荐专利
一种结合大语言模型挖掘专利信息的处理方法和装置
申请号:CN202411803496
申请日期:2024-12-10
公开号:CN119782382B
公开日期:2025-12-12
类型:发明专利
摘要
本发明实施例涉及一种结合大语言模型挖掘专利信息的处理方法和装置,所述方法包括:选择大语言模型作为第一模型,并为其指定五个目标任务,并构建五个任务数据集对其进行微调;微调结束后接收小分子药物专利的PDF文件并对其进行图像、文本块和表格提取;再基于模型进行分子图像/分子标号/无关表格筛除以及分子活性表格拼接;再基于分子图像/分子标号/拼接表格信息序列和第一模型构建标号‑图像对应关系表、基于第一模型和拼接表格信息序列构建标号‑活性信息对应关系表;并对两个对应关系表进行合并得到多模态综合信息表;最后由专利文件和多模态综合信息表组成对应挖掘报告反馈。通过本发明可以提高数据挖掘效率。
技术关键词
表格 分子 文本 序列 大语言模型 坐标 图像 指令 模板 关系 表头 字段 自然语言 多模态 标识 信息接收模块 索引 降噪模块 数据字
系统为您推荐了相关专利信息
1
邮件处理方法、装置、电子设备及计算机程序产品
邮件 深度学习模型 文本分类模型 计算机程序产品 语句
2
一种端到端的通用表格内容识别与拆分方法、装置及计算机可读存储介质
拆分方法 表格 多模态 标签结构 图像编码器
3
一种基于Prompt学习的对话状态跟踪方法
对话状态跟踪方法 注意力 指针 关键词 节点
4
一种专利价值评估方法及系统
价值评估方法 文本 生成结构化数据 情感词典 分词
5
基于用户意图识别的智能客服对话生成方法及系统
转移概率矩阵 对话生成模型 对话生成方法 智能客服系统 意图识别
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号