基于历时汉字知识图谱的古文字相似度量化方法

    公开(公告)号:CN114707615B

    公开(公告)日:2023-07-25

    申请号:CN202210461219.6

    申请日:2022-04-28

    Applicant: 吉林大学

    Abstract: 本发明提出了一种基于历时汉字知识图谱的古文字相似度量化方法,属于文字识别技术领域,该方法由历时汉字知识图谱构建步骤和古文字字形相似度计算步骤两部分组成;本发明构建知识图谱,并基于该知识图谱提出了古文字字形相似度的自动化度量方法。在汉字知识库的设计上,本发明首次针对汉字和词汇的特点,从字形、部件、文字、词汇、义项等完整层次进行建模,从而构成了汉字之间的关联网络,并且图谱具有历时性,可以关联中国各个历史时期的文字。在字形相似度的计算上,本发明利用历时汉字知识图谱中的知识,使古文字字形之间的相似性可以被量化计算。本发明提出的方法可以帮助古文字研究人员高效获取领域知识。

    一种健康知识图谱的构建方法及系统

    公开(公告)号:CN109669994A

    公开(公告)日:2019-04-23

    申请号:CN201811570602.5

    申请日:2018-12-21

    Applicant: 吉林大学

    Inventor: 徐昊 迟杨

    Abstract: 本发明涉及一种健康知识图谱的构建方法,包括:利用html标签和正则表达式直接从网络数据源抽取结构化和半结构化数据中的属于概念化表示的用户、症候、疾病、专家、治疗方案和商品的各自的实体;利用条件随机场算法对非结构化数据抽取出属于上述六个概念化表示的实体;对同一上下文中抽取到的实体对使用Bi-LSTM算法进行关系分类,确定实体间的关系;计算实体名称和实体描述之间的相关性,实现实体信息的消歧;利用jena工具的owl推理函数补全知识图谱关系,并利用准则捕捉歧义三元组,将判定可能有错误的三元组反馈给领域专家进行验证。本发明的有益效果为:构建中医理论的健康知识图谱,并运用知识推理技术对残缺关系加以自动补全,构建更加完善的健康图谱。

    一种健康知识图谱的构建方法及系统

    公开(公告)号:CN109669994B

    公开(公告)日:2023-03-14

    申请号:CN201811570602.5

    申请日:2018-12-21

    Applicant: 吉林大学

    Inventor: 徐昊 迟杨

    Abstract: 本发明涉及一种健康知识图谱的构建方法,包括:利用html标签和正则表达式直接从网络数据源抽取结构化和半结构化数据中的属于概念化表示的用户、症候、疾病、专家、治疗方案和商品的各自的实体;利用条件随机场算法对非结构化数据抽取出属于上述六个概念化表示的实体;对同一上下文中抽取到的实体对使用Bi‑LSTM算法进行关系分类,确定实体间的关系;计算实体名称和实体描述之间的相关性,实现实体信息的消歧;利用jena工具的owl推理函数补全知识图谱关系,并利用准则捕捉歧义三元组,将判定可能有错误的三元组反馈给领域专家进行验证。本发明的有益效果为:构建中医理论的健康知识图谱,并运用知识推理技术对残缺关系加以自动补全,构建更加完善的健康图谱。

    基于历时汉字知识图谱的古文字相似度量化方法

    公开(公告)号:CN114707615A

    公开(公告)日:2022-07-05

    申请号:CN202210461219.6

    申请日:2022-04-28

    Applicant: 吉林大学

    Abstract: 本发明提出了一种基于历时汉字知识图谱的古文字相似度量化方法,属于文字识别技术领域,该方法由历时汉字知识图谱构建步骤和古文字字形相似度计算步骤两部分组成;本发明构建知识图谱,并基于该知识图谱提出了古文字字形相似度的自动化度量方法。在汉字知识库的设计上,本发明首次针对汉字和词汇的特点,从字形、部件、文字、词汇、义项等完整层次进行建模,从而构成了汉字之间的关联网络,并且图谱具有历时性,可以关联中国各个历史时期的文字。在字形相似度的计算上,本发明利用历时汉字知识图谱中的知识,使古文字字形之间的相似性可以被量化计算。本发明提出的方法可以帮助古文字研究人员高效获取领域知识。

Patent Agency Ranking