-
公开(公告)号:CN119886307A
公开(公告)日:2025-04-25
申请号:CN202510070907.3
申请日:2025-01-16
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06N5/022 , G06N5/02 , G06F16/31 , G06F16/36 , G06F40/205
Abstract: 本发明提供了一种基于大模型的树形结构知识构建方法、设备及介质,涉及人工智能技术领域,所述方法包括:初始化栈,并创建栈的根节点,获取目标文章的第i行文本;若第i行文本是标题,获取目标文章的第i行文本的标题类型,按照从栈顶到栈底的顺序遍历栈中的子节点,若存在子节点与第i行文本的标题类型相同,将该子节点标记为相同类型节点,并将从栈顶到相同类型节点的全部节点出栈,若栈为空,将第i行文本作为根节点的子节点,并将第i行文本入栈;若栈不为空,获取栈的栈顶,将第i行文本作为栈顶的子节点,并将第i行文本入栈,直到目标文章的所有行遍历完成,生成目标文章的解析树;从而更加高效且准确的获取到目标文章的解析树。
-
公开(公告)号:CN119884278A
公开(公告)日:2025-04-25
申请号:CN202510070908.8
申请日:2025-01-16
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/31 , G06F40/284 , G06F16/353
Abstract: 本发明提供了大模型驱动的树索引结构在RAG内容解析中的应用方法,所述方法根据原始文本的长度和预设文本长度获取初始文本;根据初始文本对应的中间文本列表,获取中间文本列表对应的树状存储数据,其中,中间文本包括中间段落文本和中间段落文本对应的中间标题路径,中间标题路径中包括若干个标题级别不同的标题文本;获取树状存储数据中的每一个节点对应的属性信息,并将节点对应的属性信息存储到节点中,以使得对树状存储数据进行更新并给树状存储数据分配一个唯一的ID;将树状存储数据和树状存储数据的ID上传到RAG对应的数据库中,能够保证文本的整体结构和初始文本之间的语义联系不被破坏,能够提高RAG的检索效率和生成质量。
-