一种基于大型语言模型的化学文献解析和反应信息提取方法和装置

AITNT
正文
推荐专利
一种基于大型语言模型的化学文献解析和反应信息提取方法和装置
申请号:CN202410915423
申请日期:2024-07-09
公开号:CN118888046A
公开日期:2024-11-01
类型:发明专利
摘要
本发明公开了一种基于大型语言模型的化学文献解析和反应信息提取方法和装置,对化学文献进行收集并经过OCR和筛选处理,得到处理后的化学文献数据集;对处理后的化学文献数据集进行信息提取,得到反应信息提取集合。相比于传统的常规工具包或成熟软件,本发明可适用于风格迥异的各类学术期刊,而传统的软件只能适用于专利文献或格式比较单一的某一类文献;因此本发明相比现有技术具有更好的普适性。本发明的针对性更强且在面对复杂问题时性能效果更加优良。本发明与传统上通过人工收集提取化学数据的方式相比,效率更高、成本更低且综合性能更加稳定。
技术关键词
信息提取方法 人工智能助手 数据交换格式 光学字符识别技术 信息提取装置 期刊 字典 字符串替换 化学名 处理器 工具包 可读存储介质 存储器 软件 综合性 程序 字母 风格
系统为您推荐了相关专利信息
1
基于多源数据关联分析的案件侦查辅助系统
多源数据关联分析 统一数据模型 辅助系统 贝叶斯网络模型 社交网络分析
2
基于多模态大模型中文乳腺超声视频诊断报告自动生成方法
报告自动生成方法 捕捉医学图像 光学字符识别技术 图像分类器 乳腺超声图像
3
一种基于大模型的BPO图片审核系统
图片审核系统 外轮廓形状 贝塞尔曲线拟合路径 边缘轮廓 多边形
4
一种快速寻找并记录商品信息和保质期的方法
智能匹配算法 光学字符识别技术 二维码扫描技术 识别商品信息 条形码
5
一种基于持续学习的林业预训练语言模型构建方法
预训练语言模型 林业 主题 持续学习方法 信息提取方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号