基于用户定制的本体匹配系统及方法

    公开(公告)号:CN102135905A

    公开(公告)日:2011-07-27

    申请号:CN201110064824.1

    申请日:2011-03-17

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于用户定制的本体匹配系统,涉及语义万维网技术领域,包括:本体模块,包括原子组件本体操作接口子模块和本体API子模块;原子组件模块,用于通过原子组件本体操作接口子模块调用本体API子模块的本体API实现原子组件;用户接口模块,用于接收用户上传的待匹配本体和自行实现的原子组件;匹配执行模块,用于根据待匹配本体生成匹配任务描述文件,并根据匹配任务描述文件选择原子组件或自行实现的原子组件来执行匹配任务,生成匹配结果。本发明使用户能够根据匹配本体的特征,对这些原子组件进行定制和组装来设计自己需要的本体匹配流程,生成合适的匹配任务并得到精确地匹配结果。

    基于XML模式的数据绑定应用程序接口生成方法

    公开(公告)号:CN101339500A

    公开(公告)日:2009-01-07

    申请号:CN200810112277.8

    申请日:2008-05-22

    Applicant: 清华大学

    Abstract: 基于XML模式的数据绑定应用程序接口生成方法针对实际中存在的复杂XML schema规范,提出了一种自动生成用于操作符合XML Schema规范的XML文件的数据绑定API的方法。其特征为该方法以数据绑定技术为基础,首先生成一套与生成目标语言类型无关的中间层,然后通过独立的代码生成引擎生成所需类型目标代码。本文基于新华社颁布的CNML Schema(中文新闻置标语言)以及CNML稿件模板进行代码生成和测试,实验证明,这种方法在保证API的健壮性和正确性的基础上,同时具有了极大的灵活性,可以大幅降低schema规范变迁所带来的API维护成本,保持多种语言API接口的基本一致性以降低培训成本,同时也为基于API之上的应用系统提供稳定的支持。

    一种基于词频和多元文法的新闻关键词抽取方法

    公开(公告)号:CN101196904A

    公开(公告)日:2008-06-11

    申请号:CN200710177074.2

    申请日:2007-11-09

    Applicant: 清华大学

    Abstract: 一种基于词频和多元文法的新闻关键词抽取方法属于自然语言处理技术领域,其特征在于,通过研究关键词的特征词性,利用计算机辅助挖掘,提取出关键词的多元文法的潜在词性模式,并将其作为关键词抽取算法的依据。在进行新闻关键词抽取时,首先根据潜在词性模式挖掘文本中的多元词组,抽取关键词的候选词集,然后从标题中挖掘未登录的潜在关键词,将潜在关键词也加入候选关键词集中。本申请提出一个改进的单文本词汇频率/逆文本频率值(tf/idf)公式,引入有针对性的特征,对候选关键词进行评分,得出候选关键词的排名,进行结果优化后给出该新闻文档的关键词。该方法与传统的基于单文本词汇频率/逆文本频率值(tf/idf)的关键词抽取方法比较,在准确率相同的情况下,召回率更高些。

    基于专家值传播算法的社会网络专家信息处理系统及方法

    公开(公告)号:CN101075942A

    公开(公告)日:2007-11-21

    申请号:CN200710117719.3

    申请日:2007-06-22

    Applicant: 清华大学

    Inventor: 唐杰 张静 李涓子

    Abstract: 基于专家值传播算法的社会网络专家信息处理系统及方法属于社会网络信息处理领域。其特征为用社会网络生成服务器构建社会关系网络图,该图用个人描述信息、人际关系、关系类别,及人际关系到关系类别的映射函数来描述。用专家值计算服务器对从数据库服务器中读取的信息,按权重分析计算领域关键词与每个人的描述信息及论文信息的相关性,经拟合后得到初始专家值;接着按人际关系重要度及密切度构造传播矩阵,根据初始专家值和传播矩阵作迭代,得到所有专家的专家值,归一化后,从大到小排序,输出到Web服务器,供用户选择。今后,可在社会网络专家信息处理系统上,利用人际关系的重要性及密切性进行专家检索,其结果更为可靠。

    一种事件抽取方法、相关装置、设备及存储介质

    公开(公告)号:CN113761122B

    公开(公告)日:2025-03-07

    申请号:CN202110546916.7

    申请日:2021-05-19

    Abstract: 本申请实施例公开了一种事件抽取方法、相关装置、设备及存储介质,用于将句级自然语言转化为结点和边,再将结点和边转化为语义特征来进行事件抽取,能够保证获取事件的精度。本申请实施例方法包括:获取待处理文本;根据待处理文本生成抽象语义表示,抽象语义表示包括与词语一一对应的结点,以及用于连接结点之间边;对抽象语义和文本表示进行语义编码处理,得到语义嵌入向量,语义嵌入向量用于表示每个词语的与事件之间的语义特征;对抽象语义表示进行图编码处理,得到图嵌入向量,其中,图嵌入向量为用于表示通过边相连接的结点的结构特征;将语义嵌入向量与图嵌入向量进行拼接,得到拼接特征向量;对拼接特征向量进行识别,输出目标事件。

    基于新闻事件的关系分析方法及装置

    公开(公告)号:CN113158672B

    公开(公告)日:2024-11-08

    申请号:CN202110326769.2

    申请日:2021-03-26

    Applicant: 清华大学

    Abstract: 本发明提供一种基于新闻事件的关系分析方法及装置,其中方法包括:获取多篇新闻文本;对多篇新闻文本进行聚类,得到聚类后的多个新闻事件;对多个新闻事件进行实体链接、实体抽取、实体关系抽取、事件关系抽取、实体与事件关系抽取,根据实体链接结果、实体抽取结果、实体关系抽取结果、事件关系抽取结果、实体与事件关系抽取结果进行关联分析得到分析结果。本发明通过原始新闻文本聚类实现新闻事件级别分析,得到多个事件,再通过对事件文本抽取实体、实体关系、事件关系、事件与实体的关系。进而通过实体链接,将实体背景知识进行补充,实现对事件的深层次挖掘,从而使读者能够获得更全面和深入的信息。

    跨域推荐方法、装置、电子设备及存储介质

    公开(公告)号:CN115098692B

    公开(公告)日:2024-09-20

    申请号:CN202210614778.6

    申请日:2022-05-30

    Applicant: 清华大学

    Abstract: 本发明提供一种跨域推荐方法、装置、电子设备及存储介质,其中,所述方法应用于数据稀疏的目标域,目标域的目标域实体包括待推荐用户实体和待推荐商品实体,所述方法包括:获取知识图谱和源域,其中,源域中的源域实体包括源域用户实体和源域商品实体;基于知识图谱,对目标域实体和源域实体进行转换,得到目标域实体向量和源域实体向量;基于目标域实体向量和源域实体向量,通过图注意力模型得到待推荐用户实体的融合偏好特征;基于待推荐用户实体的融合偏好特征,通过跨域贝叶斯机制进行推荐,得到待推荐用户实体关于待推荐商品实体的推荐排序。通过本发明提高了对待推荐用户实体进行商品实体推荐的推荐效率。

    融合关系短语知识的关系抽取方法、装置和电子设备

    公开(公告)号:CN113705237B

    公开(公告)日:2024-07-23

    申请号:CN202110881415.4

    申请日:2021-08-02

    Applicant: 清华大学

    Abstract: 本发明提供一种融合关系短语知识的关系抽取方法、装置和电子设备,包括:确定待抽取关系语句,以及该语句中的待抽取关系的两个实体的位置信息;将所述待抽取关系语句和所述位置信息输入抽取模型,输出所述两个实体的关系类型;其中,所述抽取模型是基于样本语句、对应的样本头尾实体位置和对应的头尾实体间关系类型标签进行训练得到的,所述抽取模型训练时的网络结构包括语句编码器、协同切割关系短语表示网络、关系记忆网络和关系短语类别分类网络。本发明提供的方法、装置和电子设备,实现了融合关系短语的语义信息到关系类型中,提高了语句中关系类型抽取的准确率。

    用于为在线课程建立知识库的方法

    公开(公告)号:CN118020080A

    公开(公告)日:2024-05-10

    申请号:CN202180101405.2

    申请日:2021-08-06

    Abstract: 本公开内容提供了一种用于为在线课程建立知识库的方法。所述方法包括:从多个课程中获得多个概念,其中,所述多个课程包括视频和练习;将所述课程中包括的所述视频和所述练习中的每一项链接到所述多个概念中的一个或多个相关概念;以及将多个学生行为中的每个学生行为链接到所述多个概念中的一个或多个相关概念,其中,所建立的知识库包括以下各项:包括所述视频和所述练习的所述多个课程、所述多个学生行为、所述多个概念、所述视频与所述多个概念之间的链接、所述练习与所述多个概念之间的链接、所述学生行为与所述多个概念之间的链接。

Patent Agency Ranking