-
公开(公告)号:CN113268607A
公开(公告)日:2021-08-17
申请号:CN202110586751.6
申请日:2021-05-27
Applicant: 清华大学
IPC: G06F16/36 , G06F16/28 , G06F16/23 , G06F40/295 , G06K9/62
Abstract: 本发明提供一种知识图谱构建方法和装置,其中,方法包括对原始数据进行实体链接、关键词抽取以及命名实体识别,获得相应的结果;对相应的结果进行实体合并,得到实体列表;将实体列表中的实体作为关键词对原始数据进行文本检索,得到包含实体的文本;对包含实体的所有文本进行处理,得到表示实体的第一实体相关信息;将实体列表中的实体作为关键词输入背景知识图谱中,得到实体在背景知识图谱中的第二实体相关信息;将实体列表、第一实体相关信息,实体在背景知识图谱中的第二实体相关信息进行融合,得到新的知识图谱。本发明通过上述步骤实现对知识图谱的构建,由于新的知识图谱与背景知识图谱具有关联可用于对其进行更新。
-
公开(公告)号:CN112989808A
公开(公告)日:2021-06-18
申请号:CN202110326779.6
申请日:2021-03-26
Applicant: 清华大学
IPC: G06F40/242 , G06F40/289 , G06F40/295 , G06F40/30 , G06K9/62 , G06F16/36
Abstract: 本发明公开了一种实体链接方法及装置,所述实体链接方法包括:基于词典的方式进行实体发现,得到实体提及;基于词和实体的联合表示的方式进行实体链接,得到所述实体提及与知识库中的实体的链接关系;对所述链接关系进行减枝处理。本发明实施例在实体发现中使用基于词典的方式,在增加召回率的同时有效避免了中文分词对实体发现带来的影响,此外,本发明实施例基于词和实体联合表示的方式实现了实体链接,从而使得实体链接更加准确和丰富。通过本发明实施例的实体链接方法,实现辅助阅读,以及可用协助进行文本预处理。
-
公开(公告)号:CN111259851B
公开(公告)日:2021-04-23
申请号:CN202010076960.1
申请日:2020-01-23
Applicant: 清华大学
IPC: G06K9/00 , G06F40/211 , G06F40/258 , G06F40/289
Abstract: 本发明实施例提供一种多模态事件检测方法及装置。所述方法包括获取与待测句子匹配的待测图像集合;得到待测句子的初始的句子表达式,并得到各待测图像的图像表达式;采用交替对偶注意力机制,依次根据各图像表达式对句子表达式进行更新,得到更新后的句子表达式;采用残差融合器得到融合后的句子表达式;输入到事件预测模块得到对应的事件检测结果,本发明实施例通过获取待测句子的待测图像,分别编码得到句子表达式和图像表达式,依次根据各待测图像的图像表达式,采用交替对偶注意力机制,对句子表达式进行更新和残差融合,再将融合后的句子表达式通过事件预测模型,得到事件检测结果,从而提升了对于待测文本的事件检测的效率和质量。
-
公开(公告)号:CN112528033A
公开(公告)日:2021-03-19
申请号:CN202011242473.4
申请日:2020-11-09
Applicant: 清华大学
Abstract: 本发明提供一种知识图谱多跳推理方法、装置、电子设备及存储介质,其中,该方法包括:若判断获知未达到预设的最大跳数,则根据当前访问实体对应的状态和目标知识图谱中当前访问实体的出边,获取当前访问实体对应的动作列表;根据当前访问实体对应的状态和当前访问实体对应的动作列表,获取当前访问实体对应的动作列表中的一个动作中的实体,作为下一访问实体。本发明提供的知识图谱多跳推理方法、装置、电子设备及存储介质,根据当前访问实体对应的状态和当前访问实体的出边,对当前访问实体对应的状态对应的动作列表进行补充,将未知实体的初步预测结果补充到当前访问实体对应的状态中,能实现对稀疏的连通性较差的知识图谱更高准确性的补全。
-
公开(公告)号:CN106899932B
公开(公告)日:2020-06-09
申请号:CN201510966849.9
申请日:2015-12-21
Applicant: 清华大学
Abstract: 本发明涉及人口密度监测技术领域,尤其涉及一种活跃人口密度监测方法和系统。本发明提供的活跃人口密度监测方法,包括:根据全球小区识别码、小区与待监测基站的对应关系和待监测基站的经纬度信息确定待监测基站服务覆盖范围Bsid;计算待监测基站服务覆盖范围Bsid的覆盖面积Ssid;根据待监测基站所在移动通信网络平台的移动信令数据确定待监测基站覆盖范围Bsid内的非重复用户数量C;计算非重复用户数量C与覆盖面积Ssid的商作为待监测基站服务覆盖范围Bsid内活跃人口密度。本方法利用移动运营商的现有设备,几乎不需要新投入,就能够直观、有效地监测移动网络覆盖范围内的活跃人口密度实时状况。
-
公开(公告)号:CN106874303A
公开(公告)日:2017-06-20
申请号:CN201510925346.7
申请日:2015-12-14
Applicant: 清华大学
CPC classification number: G06F17/30595 , G06F17/30604 , G06Q10/0633 , G06Q50/26
Abstract: 本发明涉及一种业务办理流程管理系统,包括:业务获取单元、业务关联单元、业务存储单元;所述业务获取单元用于获取所有业务的业务信息;所述业务关联单元用于根据业务信息,确定业务办理先后顺序,并根据所述业务办理先后顺序将业务进行关联;业务存储单元用于存储关联后的所有业务的业务信息。通过采用本发明所提供的业务办理流程管理系统和方法,自动化的将各个业务关联起来,各个部门/机构的业务可以独立运作,解决了业务办理流程维护难度大的问题;所有的业务关联在一起,系统能够根据用户的查询给用户反馈最终的办事流程;业务查询不针对某些部门或机构,业务查询是跨部门、机构的,提高了市民查询业务办理流程的效率和体验。
-
公开(公告)号:CN101917413A
公开(公告)日:2010-12-15
申请号:CN201010239916.4
申请日:2010-07-29
Applicant: 清华大学
Abstract: 本发明公开一种基于服务质量优化和语义信息集成的服务组装系统及方法,主要是为了提高服务组装的可靠性、稳定性和服务质量而设计。本发明包括:Web服务网络,提供服务及其对应的输入/输出数据类型;本体概念网络数据库,提供本体概念;索引产生服务器,建立服务的输入/输出数据类型和本体概念之间的“服务-数据类型-本体”索引,并将该索引存储在所述索引产生服务器内;服务组装引擎服务器,接收客户端需求的输入/输出数据类型,并在“服务-数据类型-本体”索引中查询与其匹配的数据类型,依据服务组装算法进行服务组装,得出服务组装结果;以及服务组装结果执行服务器。本发明集成了语义信息,服务质量最优,且能够高效地处理大规模的服务组装。
-
公开(公告)号:CN119357324A
公开(公告)日:2025-01-24
申请号:CN202411374260.5
申请日:2024-09-29
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F40/284
Abstract: 本发明提供一种基于知识引导的访谈交互数据处理方法及系统,该方法包括:在当前访谈交互过程的每轮对话中获得当前上下文内容,基于当前上下文内容及行动映射策略进行拼接处理,获得第一提示词;将第一提示词输入到语言模型,获得输出的下一轮对话中采用的至少一个目标行动策略;基于语言模型对获取的访谈指南信息和至少一个目标行动策略进行处理,获得语言模型输出的下一轮对话的访谈交互问题;在基于语言模型确定当前访谈交互过程完成的情况下,获得输出的与当前访谈交互过程对应的全部对话交互内容,并对全部对话交互内容进行分析,获得对话交互内容分析结果。本发明提供的方法,能够有效提高访谈交互数据处理的效率,从而大幅降低了人力成本。
-
公开(公告)号:CN112989808B
公开(公告)日:2025-01-03
申请号:CN202110326779.6
申请日:2021-03-26
Applicant: 清华大学
IPC: G06F40/242 , G06F40/289 , G06F40/295 , G06F40/30 , G06F18/2415 , G06F16/36
Abstract: 本发明公开了一种实体链接方法及装置,所述实体链接方法包括:基于词典的方式进行实体发现,得到实体提及;基于词和实体的联合表示的方式进行实体链接,得到所述实体提及与知识库中的实体的链接关系;对所述链接关系进行减枝处理。本发明实施例在实体发现中使用基于词典的方式,在增加召回率的同时有效避免了中文分词对实体发现带来的影响,此外,本发明实施例基于词和实体联合表示的方式实现了实体链接,从而使得实体链接更加准确和丰富。通过本发明实施例的实体链接方法,实现辅助阅读,以及可用协助进行文本预处理。
-
公开(公告)号:CN112487213B
公开(公告)日:2024-12-03
申请号:CN202011507796.1
申请日:2020-12-18
Applicant: 清华大学
IPC: G06F16/36 , G06F40/289
Abstract: 本发明提供一种跨语言领域知识图谱构建方法及装置,所述方法包括:获取目标领域对应的至少两种语言的种子词汇;利用所述至少两种语言的种子词汇,进行词汇扩展,直至扩展得到的词汇数量满足预设条件,获得所述至少两种语言的扩展词汇;对所述至少两种语言的扩展词汇执行交叉补充操作,获得所述目标领域的相关词汇;从现有数据库中提取所述相关词汇对应的原始数据;对所述原始数据进行知识图谱的构建,生成所述目标领域的知识图谱。本发明实现了适用于任何领域的跨语言领域知识图谱的构建方法,知识图谱的构建过程中无需依赖该特定领域的专家知识和行业调研才能实现,可有效提升知识图谱的构建效率,节省人力物力。
-
-
-
-
-
-
-
-
-