-
公开(公告)号:CN109215798A
公开(公告)日:2019-01-15
申请号:CN201811174093.4
申请日:2018-10-09
Applicant: 北京科技大学
IPC: G16H50/70
Abstract: 本发明提供一种面向中医古文的知识库构建方法,能够快速构建面向中医古文的知识库,省时省力。所述方法包括:对中医古文语料进行关键词提取获取词频大于预设的词频阈值的实体,形成种子实体词表;根据种子实体词表,筛选出中医古文语料中具有两个及两个以上实体的句子,利用依存句法分析得到实体之间的动词关系,形成种子动词词表;根据种子动词词表,扩充种子实体词表;迭代执行形成种子动词词表和扩充种子实体词表的步骤,直到不能获取到新的实体和动词,形成实体关系三元组;根据得到的种子实体词表进行层次聚类,得到分类后的实体词表,并结合得到的实体关系三元组,构建面向中医古文知识库。本发明涉及知识工程领域。
-
公开(公告)号:CN107122451A
公开(公告)日:2017-09-01
申请号:CN201710281403.1
申请日:2017-04-26
Applicant: 北京科技大学
Abstract: 本发明提供一种法律文书案由分类器的自动构建方法,分类效率高、准确率高。所述方法包括:获取多类案由的法律文书,确定每类案由的测试语料;对每类测试语料去停用词和分词;根据分词结果,确定每类案由的基本关键词;根据分词结果,对每类测试语料进行词向量训练,扩充关键词,根据扩充的关键词和确定的基本关键词,确定每类案由的扩充关键词列表;输入待分类法律文书,对输入的所述待分类法律文书去停用词和分词、并进行词向量训练,根据所述待分类法律文书的词向量训练结果,计算所述待分类法律文书与每类扩充关键词列表的语义相似度总和,取语义相似度总和最大值对应的案由为所述待分类法律文书对应的案由。本发明涉及知识工程技术领域。
-
公开(公告)号:CN107122451B
公开(公告)日:2020-01-21
申请号:CN201710281403.1
申请日:2017-04-26
Applicant: 北京科技大学
IPC: G06F16/35 , G06F16/33 , G06F40/216 , G06F40/30
Abstract: 本发明提供一种法律文书案由分类器的自动构建方法,分类效率高、准确率高。所述方法包括:获取多类案由的法律文书,确定每类案由的测试语料;对每类测试语料去停用词和分词;根据分词结果,确定每类案由的基本关键词;根据分词结果,对每类测试语料进行词向量训练,扩充关键词,根据扩充的关键词和确定的基本关键词,确定每类案由的扩充关键词列表;输入待分类法律文书,对输入的所述待分类法律文书去停用词和分词、并进行词向量训练,根据所述待分类法律文书的词向量训练结果,计算所述待分类法律文书与每类扩充关键词列表的语义相似度总和,取语义相似度总和最大值对应的案由为所述待分类法律文书对应的案由。本发明涉及知识工程技术领域。
-
公开(公告)号:CN109215798B
公开(公告)日:2023-04-07
申请号:CN201811174093.4
申请日:2018-10-09
Applicant: 北京科技大学
IPC: G16H50/70
Abstract: 本发明提供一种面向中医古文的知识库构建方法,能够快速构建面向中医古文的知识库,省时省力。所述方法包括:对中医古文语料进行关键词提取获取词频大于预设的词频阈值的实体,形成种子实体词表;根据种子实体词表,筛选出中医古文语料中具有两个及两个以上实体的句子,利用依存句法分析得到实体之间的动词关系,形成种子动词词表;根据种子动词词表,扩充种子实体词表;迭代执行形成种子动词词表和扩充种子实体词表的步骤,直到不能获取到新的实体和动词,形成实体关系三元组;根据得到的种子实体词表进行层次聚类,得到分类后的实体词表,并结合得到的实体关系三元组,构建面向中医古文知识库。本发明涉及知识工程领域。
-
公开(公告)号:CN107122444A
公开(公告)日:2017-09-01
申请号:CN201710270508.7
申请日:2017-04-24
Applicant: 北京科技大学
IPC: G06F17/30
CPC classification number: G06F16/3335 , G06F16/335 , G06F16/367
Abstract: 本发明提供一种法律知识图谱自动构建方法,能够根据审判文书自动构建法律知识图谱。所述方法包括:对获取的审判文书去停用词和进行分词;分别抽取三类审判文书的主题词,对抽取的主题词进行词性标注和过滤,根据过滤结果,抽取名词或名词短语主题词作为法律知识图谱的实体概念;获取与抽取的每一名词或名词短语主题词关系相近的词,对获取的相近词进行词性标注和过滤,根据过滤结果,抽取名词或名词短语相近词作为法律知识图谱的实体概念;根据抽取的主题词实体概念和相近词实体概念以及其之间的关系形成的主题词‑主题关系‑主题词,主题词‑相近关系‑相近词三元组结构,构建法律知识图谱。本发明涉及知识工程技术领域。
-
公开(公告)号:CN109190113B
公开(公告)日:2021-08-31
申请号:CN201810910004.1
申请日:2018-08-10
Applicant: 北京科技大学
IPC: G06F16/36 , G06F16/35 , G06F40/295 , G06F16/951 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种中医理论典籍的知识图谱构建方法,能够提高构建的知识图谱的准确率。所述方法包括:确定中医理论典籍中的实体词表和动词词表;根据确定的实体词表,对中医理论典籍中的实体进行标注;根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。本发明涉及知识工程领域。
-
公开(公告)号:CN109190113A
公开(公告)日:2019-01-11
申请号:CN201810910004.1
申请日:2018-08-10
Applicant: 北京科技大学
Abstract: 本发明提供一种中医理论典籍的知识图谱构建方法,能够提高构建的知识图谱的准确率。所述方法包括:确定中医理论典籍中的实体词表和动词词表;根据确定的实体词表,对中医理论典籍中的实体进行标注;根据已标注实体的中医理论典籍,通过基于字符的双向长短期记忆网络和基于统计方法的条件随机场的循环神经网络进行实体识别,得到中医理论典籍中的实体;根据识别出的中医理论典籍中的实体,利用结合注意力机制的双向门控循环单元神经网络进行关系抽取,获取中医理论典籍中实体之间的关系,形成实体关系表;以实体关系表中的实体为节点集,实体关系表中的关系为边集,构建中医理论典籍的知识图谱。本发明涉及知识工程领域。
-
-
-
-
-
-