摘要
本发明公开了一种基于LLM大语言模型的智能问答系统构建方法及系统,方法包括:从多种异构数据源中进行语料聚合,动态抓取与目标领域相关的文本数据;对文本数据初步筛选,基于语义相似性与文本质量评分规则,剔除冗余、低质量或与目标领域不相关的文本数据;对文本数据多样性分析,通过对抗生成技术,生成与真实数据相似度高的多样化文本数据;将文本数据多层次语义标注,通过分析标注后的语料中的上下文信息,生成训练样本;将训练样本转换为标准格式样本,并利用标准格式样本训练LLM大语言模型,作为目标领域的智能问答系统。利用本发明实施例,能够有效提升智能问答系统在各种应用场景下的智能化水平,推动智能问答技术的进一步发展。
技术关键词
文本
智能问答系统
数据
生成训练样本
拼写错误检测
语义
生成技术
多层次
智能问答技术
格式
自然语言
主题
分析模块
冗余
实体
异构
关键词
抓取模块
系统为您推荐了相关专利信息
健康监测方法
健康监测程序
视频流
多模态交互
健康监测数据
水文水资源监测
液压压力传感器
流速发电装置
水质检测仪
动态变化模型
航空发动机叶片
碳纳米管阵列
传感模块
策略
多光谱
室内无线指纹定位
网格
马尔科夫模型
贝叶斯模型
指纹数据库