标记语言文档处理方法、装置、设备和存储介质

AITNT
正文
推荐专利
标记语言文档处理方法、装置、设备和存储介质
申请号:CN202411074589
申请日期:2024-08-06
公开号:CN118981524A
公开日期:2024-11-19
类型:发明专利
摘要
本申请实施例提供了一种标记语言文档处理方法、装置、设备和存储介质,逐个解析标记语言文档,得到与若干个标题一一对应的若干个标题文档与若干个文档拼接信息;根据若干个文档拼接信息之间的第一相似度以及层级关系将若干个标题文档存储至预设数据库;使用用户发送的问题文本检索预设数据库中的备选标题文档;按照备选标题文档与问题文本的之间的第二相似度选取目标标题文档;将目标标题文档与问题文本输入大型语言模型,以获取针对问题文本的回答文本。本申请实施例提升了解析和检索标记语言格式文本方面的精准度和检索结果的相关性。
技术关键词
文本 层级 解析标记语言文档 关系 机器可读介质 语义 遍历方式 云平台 排序模型 拼接模块 处理器 输入模块 存储模块 节点 电子设备 分词 字段
系统为您推荐了相关专利信息
1
一种视频风险检测方法及装置
关键帧 文本 光学字符识别 风险检测方法 视频解码
2
保险理赔方法、装置、设备、区块链节点、介质及产品
理赔事件 计算机执行指令 参数 理赔方法 风险
3
科技项目风险控制的知识图谱生成方法及系统
动态知识图谱 知识图谱生成方法 节点 语义向量 序列
4
基于潜在扩散模型的语音合成方法、装置、服务器及介质
语音 情感特征 音频解码器 文本 音频编码器
5
基于知识图谱的法律咨询交互方法、电子设备及介质
法律知识图谱 大语言模型 交互方法 生成回复信息 实体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号