用于确定问题答案的方法、装置及存储介质

    公开(公告)号:CN118861254A

    公开(公告)日:2024-10-29

    申请号:CN202411109296.0

    申请日:2024-08-13

    Inventor: 王思祺 王蕴韬

    Abstract: 本申请涉及人工智能技术领域,尤其是一种用于确定问题答案的方法、装置及存储介质。包括:确定定位问题并向量化;对待解答问题进行向量化;确定多个待选定位问题;确定待检索子文档和与向量化后的待解答问题对应的目标文档片段;在目标文档片段的数量小于预设数值的情况下,调整待解答问题,以得到至少一个调整后的待解答问题;从调整后的待解答问题中确定出新的待解答问题,并再次回到对待解答问题进行向量化的步骤,直至目标文档片段的数量大于预设数值;根据目标文档片段确定针对待解答问题的答案,实现了文档的分层处理,能够精确地定位问题,避免了答非所问和重复检索工作,提高了文档检索效率,能够快速并准确地确定问题答案。

    一种基于网页生成PDF的方法、装置、设备及存储介质

    公开(公告)号:CN115758027A

    公开(公告)日:2023-03-07

    申请号:CN202211473789.3

    申请日:2022-11-22

    Abstract: 本申请提供一种基于网页生成PDF的方法、装置、设备及存储介质,所述方法包括:获得网页访问路径及待访问网页的核心内容的Xpath路径;基于所述网页访问路径向网页发送访问请求,获得反馈的网页数据;确定所述网页数据的网页元素节点树;基于所述Xpath路径中的内容及网页元素节点树确定出所述网页数据中需要删除的非核心数据,所述非核心数据为所述网页数据中除核心数据及其显示相关数据以外的数据;删除所述网页中的非核心数据;基于所述网页数据中显示的核心数据生成对应的PDF文件。本申请基于网页生成PDF的方法能够直接对网页内容转换为PDF文件,且排版正常,支持文件内容不失真放大。

    文本召回方法、装置、计算设备及机器可读存储介质

    公开(公告)号:CN117786045A

    公开(公告)日:2024-03-29

    申请号:CN202311765523.0

    申请日:2023-12-20

    Abstract: 本申请实施例公开了一种文本召回方法、装置、计算设备及机器可读存储介质,属于数据处理领域。文本召回方法包括:根据目标文本和目标文本的文本长度,确定第一数量的关键词;根据每个关键词在目标文本中的出现顺序,将第一数量的关键词进行组合,得到关键文本;分别对关键词和关键文本进行向量化,得到关键词向量和关键文本向量;将关键文本向量与所有的关键词向量进行加权求和,得到目标文本对应的向量映射;根据向量映射对目标文本进行向量召回,生成目标文本的文本召回结果。在限制关键词数量的基础上,基于每个关键词的重要性,得到目标文本对应的向量映射。通过向量映射进行文本召回,能够得到高准确性的文本召回结果。

Patent Agency Ranking