摘要
本发明涉及计算机技术,提供一种文本切分方法、装置、电子设备及计算机可读存储介质,所述方法包括:获取针对目标文本进行句子级别切分后得到的多个句子;以多个句子中的第一个句子为起点、最后一个句子为终点,多次滑动预设滑动窗口,并在每次滑动后,将处于预设滑动窗口内的多个目标句子按照语义切分,得到至少一个语义段;对于每次切分得到的语义段,将本次切分得到的语义段和上次切分得到的语义段进行聚类,得到上次滑动后和本次滑动后预设滑动窗口内的每一目标句子所属的目标语义段,直至得到所述多个句子中每一句子所属的语义段。本发明能够保证语义连贯,提升RAG系统问答的准确性和可靠性。
技术关键词
语义
文本切分方法
滑动窗口
聚类
可读存储介质
序列
电子设备
切分装置
终点
计算机
处理器
存储器
模块
程序
数据