基于问题对匹配和问答对匹配的问答匹配方法及系统

    公开(公告)号:CN115391513A

    公开(公告)日:2022-11-25

    申请号:CN202211063932.1

    申请日:2022-08-31

    Abstract: 本发明属于问答匹配技术领域,提供了一种基于问题对匹配和问答对匹配的问答匹配方法及系统,在获取问题后,先通过预设的问句‑问句匹配模型,得到问题中的问句向量表示和预设问答库中问句的向量表示,在此基础上计算问题中的问句和预设问答库中问句之间的相似度,对问答库进行初步筛选;然后,再通过预设的问句‑答案匹配模型,得到问题中的问句向量表示和筛选后问答库中答案的向量表示,在此基础上,计算问题中的问句和筛选后问答库中答案之间的相似度,并将相似度得分最高的问答对作为获取问题最终匹配的问答对;在问答对匹配过程中,两次相似度计算实现了对问答对的初步筛选和最终确定,提高了相似度计算的精度,保证了匹配效果。

    政策类网页正文提取方法、系统、设备及存储介质

    公开(公告)号:CN111966901B

    公开(公告)日:2021-04-20

    申请号:CN202010825873.1

    申请日:2020-08-17

    Abstract: 本发明公开了政策类网页正文提取方法、系统、设备及存储介质,包括:获取政策网页HTML源代码;根据政策网页HTML源代码,获取网页正文所在的位置;根据网页正文所在的位置,获取正文所对应的HTML源代码,输出正文所对应的HTML源代码。过分析政策网页的页面组织结构规则,构建网页组织结构和网页正文位置的关系,获取网页正文内容。从而实现对政策类网页正文的快速、有效提取。本发明的实施使得政策类网页正文的提取实现了快速、高效获取,大大提高了工作效率,节省公司的人力成本,同时经验证,该发明也取得较高的准确率。

    基于提示学习的知识抽取方法及系统

    公开(公告)号:CN117056515A

    公开(公告)日:2023-11-14

    申请号:CN202311027108.5

    申请日:2023-08-15

    Abstract: 本发明提供了一种基于提示学习的知识抽取方法及系统,将获取的非结构化文本数据进行嵌入得到缓存向量值;对同质提示符串进行嵌入得到同质提示符向量值,对异质提示字符串进行嵌入得到异质提示字符向量值;对缓存向量值、同质提示符向量值和异质提示字符向量值进行拼接得到拼接向量,以拼接向量作为预训练语言模型的缓存向量值;采用正则匹配的方法从预训练语言模型生成的文本数据中获取结构化数据;本发明利用自动编码的提示字符,自动学习标签的潜在语义表示,并通过生成式大规模预训练语言模型,以通用的方式解决知识抽取问题,提高了知识抽取的精度和效率。

    基于稀疏特征的重名消歧方法及系统

    公开(公告)号:CN115510334A

    公开(公告)日:2022-12-23

    申请号:CN202211201364.7

    申请日:2022-09-29

    Abstract: 本公开提供了一种基于稀疏特征的重名消歧方法及系统,包括:获取人才库中存储的人才数据信息,并从中筛选出重复人名的数据构建重名人才库;从所述重名人才库中获取人名列表;对所述人名列表进行遍历,并从所述重名人才库中获取当前人名所对应的数据记录;对于获得的数据记录中的每条数据记录,两两计算其相似性;基于相似性计算结果,利用指向同一实体的两条数据记录的唯一标识组成元组,并加入无向图构建的边集合中;以所述数据记录中的id列表作为节点,并以所述边集合中的元组作为边,实现无向图的构建;计算所述无向图中的所有连通子图集合,并对同一连通子图中的节点添加相同的标签,基于所述标签实现对相同人名数据记录的区分。

Patent Agency Ranking