-
公开(公告)号:CN112650817A
公开(公告)日:2021-04-13
申请号:CN202011444885.6
申请日:2020-12-08
Applicant: 清华大学
IPC: G06F16/28 , G06F40/289
Abstract: 本发明提供一种关键词汇扩展方法及系统、电子设备及存储介质,包括:S1:基于关键词汇,从数据库中提取出与关键词汇相对应的文本数据;S2:对所述文本数据进行实体链接,得到和关键词汇相关的关联要素;S3:基于所述关键词汇和关联要素,进行相关性筛选,得到筛选后的词汇;S4:判断所述筛选后的词汇是否满足预设条件;若是,执行S5;若否,则将所述筛选后的词汇作为关键词汇,返回所述S1;S5:将筛选后的词汇汇总作为关键词汇的相关词汇列表。本发明只需要使用少量的领域种子词汇或种子文本,通过较少的人力成本、时间能够快速实现领域词汇扩展的任务。
-
公开(公告)号:CN112527924A
公开(公告)日:2021-03-19
申请号:CN202011507777.9
申请日:2020-12-18
Applicant: 清华大学
Abstract: 本发明提供一种动态更新的知识图谱扩展方法及装置,所述方法包括:基于第一知识库,进行知识图谱的构建,生成目标领域的知识图谱,其中,所述第一知识库由目标领域的原始数据构成;基于所述目标领域的新知识,生成第二知识库,并将所述第二知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱;和/或,基于所述知识图谱,执行知识赋能操作,获得所述知识图谱的应用方案,并对所述应用方案执行知识推理操作,得到第三知识库,将所述第三知识库中的数据扩展到所述知识图谱中,获得更新后的知识图谱。本发明提供的动态更新的知识图谱扩展方法及装置,可以实现知识图谱的动态扩展,保证了知识图谱的动态更新和实时性。
-
公开(公告)号:CN110147436B
公开(公告)日:2021-02-26
申请号:CN201910203301.7
申请日:2019-03-18
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F16/33
Abstract: 本发明属于智慧教育问答技术领域,尤其涉及一种基于教育知识图谱与文本的混合自动问答方法,包括:通过构建基础教育本体、语义标注、信息抽取来构建基础教育知识图谱;根据关键词结合正则表达式,构建问题的通用模板;搭建全文搜索引擎,对海量文本进行预处理;将试题问答对作为训练集合,训练至深度文本匹配模型收敛;对用户问题进行识别得到主语列表,并赋予置信度;进行模板匹配得到谓语列表,并赋予置信度;根据主语和谓语列表查询知识图谱得到答案列表,并赋予置信度;使用词性标注方法得到关键词,进行粗、细粒度匹配得到答案并排序;如果基于教育知识图谱的答案的最高置信度超过阈值,则返回该答案;否则返回基于文本的排序最前的答案。
-
公开(公告)号:CN111259851A
公开(公告)日:2020-06-09
申请号:CN202010076960.1
申请日:2020-01-23
Applicant: 清华大学
IPC: G06K9/00 , G06F40/211 , G06F40/258 , G06F40/289
Abstract: 本发明实施例提供一种多模态事件检测方法及装置。所述方法包括获取与待测句子匹配的待测图像集合;得到待测句子的初始的句子表达式,并得到各待测图像的图像表达式;采用交替对偶注意力机制,依次根据各图像表达式对句子表达式进行更新,得到更新后的句子表达式;采用残差融合器得到融合后的句子表达式;输入到事件预测模块得到对应的事件检测结果,本发明实施例通过获取待测句子的待测图像,分别编码得到句子表达式和图像表达式,依次根据各待测图像的图像表达式,采用交替对偶注意力机制,对句子表达式进行更新和残差融合,再将融合后的句子表达式通过事件预测模型,得到事件检测结果,从而提升了对于待测文本的事件检测的效率和质量。
-
公开(公告)号:CN110147436A
公开(公告)日:2019-08-20
申请号:CN201910203301.7
申请日:2019-03-18
Applicant: 清华大学
IPC: G06F16/332 , G06F16/36 , G06F16/33
Abstract: 本发明属于智慧教育问答技术领域,尤其涉及一种基于教育知识图谱与文本的混合自动问答方法,包括:通过构建基础教育本体、语义标注、信息抽取来构建基础教育知识图谱;根据关键词结合正则表达式,构建问题的通用模板;搭建全文搜索引擎,对海量文本进行预处理;将试题问答对作为训练集合,训练至深度文本匹配模型收敛;对用户问题进行识别得到主语列表,并赋予置信度;进行模板匹配得到谓语列表,并赋予置信度;根据主语和谓语列表查询知识图谱得到答案列表,并赋予置信度;使用词性标注方法得到关键词,进行粗、细粒度匹配得到答案并排序;如果基于教育知识图谱的答案的最高置信度超过阈值,则返回该答案;否则返回基于文本的排序最前的答案。
-
公开(公告)号:CN106407208A
公开(公告)日:2017-02-15
申请号:CN201510455748.5
申请日:2015-07-29
Applicant: 清华大学
IPC: G06F17/30
CPC classification number: G06F16/313 , G06F16/334 , G06F16/367
Abstract: 本发明提供了一种城市管理本体知识库的构建方法及系统,该方法包括:获取各城市管理部门系统的数据集以及与各部门相关的法律法规文档;根据预设策略对各部门系统的数据集以及与各部门相关的法律法规文档进行知识抽取,得到对应的第一知识实体集和第二知识实体集;为第一知识实体集和第二知识实体集中的所有知识实体添加关键字标签和唯一标识符,根据关键字标签建立所述第一知识实体集中的知识实体与第二知识实体集中的知识实体之间的实体链接关系,得到本体知识库中的实例;获取与每一实例相匹配的互联网数据,并建立每一实例与对应的互联网数据之间的链接。本发明解决了部门间信息的互通问题,实现自动化的知识抽取和本体知识库构建。
-
公开(公告)号:CN103886323B
公开(公告)日:2017-02-15
申请号:CN201310439425.8
申请日:2013-09-24
Applicant: 清华大学
IPC: G06K9/62
Abstract: 本发明公开一种基于移动终端的行为识别方法及移动终端,主要针对现有人体行为识别方法中特征集的抽取能耗大而设计。本发明,通过移动终端的传感器采集行为的传感数据;将所述传感数据通过小波函数变换为小波特征向量;基于所述小波特征向量进行行为的特征值的抽取,得到行为的特征集;将所述特征集中的数据进行训练,取得分类器;对未知行为进行识别步骤。本发明通过在小波域下提取人体行为的特征集,在保证了特征集的抽取效率和精准度的前提下,降低了人体行为特征集抽取的能耗。
-
公开(公告)号:CN102270136B
公开(公告)日:2015-04-08
申请号:CN201110228830.6
申请日:2011-08-10
Applicant: 清华大学
IPC: G06F9/44
Abstract: 本发明提供了一种需求特征建模到体系结构建模的平滑过渡方法,所述方法包括:提出了一种面向数据处理领域的特征建模方法,建立了一种面向数据处理领域的特征建模工具,并在此基础上通过向体系结构描述语言(Data Process Oriented Software Product Line Architecture Description Language,简称DPOSPLADL)的转换实现了需求特征建模到体系结构建模的平滑过渡。
-
公开(公告)号:CN102455421B
公开(公告)日:2014-03-26
申请号:CN201010521203.7
申请日:2010-10-27
Applicant: 清华大学
Abstract: 本发明公开一种无需时间同步的声音定位系统及方法,主要是为了解决已有定位系统对时间同步的依赖,且时间同步本身带来的误差和额外开销的问题而设计。本发明包括:待定位节点,对外发出声源信号;两个以上的接收器,分为基准接收器和信标接收器两种,录制所述待定位节点发出的声源信号以及所述基准接收器对外发出的后继声源信号,并将录制结束后的录音数据输出给服务器;服务器,接收各接收器输出的录音数据,并依据该录音数据计算出待定位节点的位置并将其显示在服务器界面上;以及,无线AP,构建所述待定位节点,接收器和服务器组成的无线局域网络。本发明去除了定位系统中的时间同步,并获得了较好的定位精度。
-
公开(公告)号:CN102270137B
公开(公告)日:2014-01-01
申请号:CN201110228837.8
申请日:2011-08-10
Applicant: 清华大学
IPC: G06F9/44
Abstract: 本发明提供了一种获取体系结构描述语言的方法和一种建模工具,所述的方法包括:首先制定一种能描述产品线变化性的DPOSPL ADL元模型;然后,在DPOSPL ADL中引入变量定义和赋值语法;最后,根据体系结构模型的约束,制定DPOSPL ADL的描述规范;所述的体系结构描述语言支持领域分析后的需求特征模型到体系架构模型的转换,可针对需求特征模型中的可变点快速开发出针对特定需求的实际产品的体系架构。
-
-
-
-
-
-
-
-
-