-
公开(公告)号:CN113065355B
公开(公告)日:2022-08-26
申请号:CN202110525518.7
申请日:2021-05-12
Applicant: 清华大学
IPC: G06F40/295 , G06F40/30 , G06F16/36
Abstract: 本发明涉及一种人工智能,揭露一种专业百科命名实体识别方法,包括:通过文档嵌入的方式对标准化词表中的专业词汇进行向量化表示,以形成种子词集合;将所述种子词集合中的各个实体类别的向量求平均,以获取所述实体类别的向量化表示,作为所述种子词集合中的实体类别的标签向量;根据目标文档中候选专业实体的标签向量和所述种子集合中的实体类别的标签向量,通过余弦相似度对比确定所述候选专业实体所属的类别。利用本发明,能够克服现有的监督学习实体识别方法中由于标注中专业语料的缺失以及人工标注文本所需的极高人力成本的缺陷,有效提高百科类文本信息抽取和实体识别的效率。
-
公开(公告)号:CN113158676A
公开(公告)日:2021-07-23
申请号:CN202110517839.2
申请日:2021-05-12
Applicant: 清华大学
IPC: G06F40/295 , G06F40/211 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种人工智能,揭露一种专业实体与关系联合抽取方法,包括:利用双向编码器语言表示模型对目标文本进行编码,以获取所述目标文本的向量集合;对所述向量集合进行专业命名实体识别,以确定所述目标文本中实体的位置信息;根据所述实体的位置信息进行关系抽取;以BERT中的全部参数作为实体识别和关系抽取的共享参数,对实体识别和关系抽取进行联合训练。利用本发明,能够有效降低专业实体与关系联合抽取的人工成本,提高专业实体与关系联合抽取的效率和准确率。
-
公开(公告)号:CN113065355A
公开(公告)日:2021-07-02
申请号:CN202110525518.7
申请日:2021-05-12
Applicant: 清华大学
IPC: G06F40/295 , G06F40/30 , G06F16/36
Abstract: 本发明涉及一种人工智能,揭露一种专业百科命名实体识别方法,包括:通过文档嵌入的方式对标准化词表中的专业词汇进行向量化表示,以形成种子词集合;将所述种子词集合中的各个实体类别的向量求平均,以获取所述实体类别的向量化表示,作为所述种子词集合中的实体类别的标签向量;根据目标文档中候选专业实体的标签向量和所述种子集合中的实体类别的标签向量,通过余弦相似度对比确定所述候选专业实体所属的类别。利用本发明,能够克服现有的监督学习实体识别方法中由于标注中专业语料的缺失以及人工标注文本所需的极高人力成本的缺陷,有效提高百科类文本信息抽取和实体识别的效率。
-
公开(公告)号:CN114422137B
公开(公告)日:2024-04-30
申请号:CN202111508147.8
申请日:2021-12-10
Applicant: 清华大学
IPC: H04L9/32
Abstract: 本发明提供一种安全分布式时间管理方法,首先对各个节点进行协议初始化处理,使各个节点对哈希算法的参数的选择达成共识,并根据预设的单轮时间按轮次执行协议,基于该协议中的状态算法接收需要登记时间戳的记录,将所述记录封装为区块并广播,实时接收其他节点产生的区块,并将区块连接为有向无环图,通过时间戳算法输出记录的时间戳,通过证明算法输出用于验证时间戳与记录的轮次证明;而后通过验证算法对轮次证明进行参数解析以判断时间戳的有效性,若时间戳有效则完成当前的时间戳管理,整个过程以有向无环图链存储和管理时间戳,且经过验证算法的验证,如此提高安全性和可靠性,并且具有高节点容量和高吞吐量,能够支持大规模时间戳应用。
-
公开(公告)号:CN114627050A
公开(公告)日:2022-06-14
申请号:CN202210109129.0
申请日:2022-01-28
Applicant: 清华大学
IPC: G06T7/00 , G06F16/583 , G06K9/62 , G06T7/11 , G06V10/764 , G06V10/74
Abstract: 本发明提供一种基于肝部病理全切片的病例分析方法及系统,属于计算机视觉技术领域,通过对大型的肝部病理全切片图进行预处理和数据清洗过程,从有较多无关冗余信息的、超高分辨率的病理全切片图中提取出对于描述特定组织特征、辅助医生作出诊断比较关键的区域;同时,将利用这些包含特定组织的区域作为分析的基础,对某些待分析的病理图像,在预先建立的病例图像数据库中进行寻找包含特定相似区域的病例图像,将筛选到的病例图像进行排序并可视化输出;提高分析结果的准确性,满足医生的检索需求的技术效果。
-
公开(公告)号:CN114422137A
公开(公告)日:2022-04-29
申请号:CN202111508147.8
申请日:2021-12-10
Applicant: 清华大学
IPC: H04L9/32
Abstract: 本发明提供一种安全分布式时间管理方法,首先对各个节点进行协议初始化处理,使各个节点对哈希算法的参数的选择达成共识,并根据预设的单轮时间按轮次执行协议,基于该协议中的状态算法接收需要登记时间戳的记录,将所述记录封装为区块并广播,实时接收其他节点产生的区块,并将区块连接为有向无环图,通过时间戳算法输出记录的时间戳,通过证明算法输出用于验证时间戳与记录的轮次证明;而后通过验证算法对轮次证明进行参数解析以判断时间戳的有效性,若时间戳有效则完成当前的时间戳管理,整个过程以有向无环图链存储和管理时间戳,且经过验证算法的验证,如此提高安全性和可靠性,并且具有高节点容量和高吞吐量,能够支持大规模时间戳应用。
-
公开(公告)号:CN113672603A
公开(公告)日:2021-11-19
申请号:CN202110919217.2
申请日:2021-08-11
Applicant: 清华大学 , 国网能源研究院有限公司 , 国网四川省电力公司
IPC: G06F16/215 , G06F16/25 , G06Q50/06
Abstract: 本发明提供一种基于多源异构的电力大数据自动化标签实现方法,首先将各个电力参与方作为节点构成分布式计算机模型,获取各个节点的存储数据和信息数据,并按照主题类别将归类后的存储数据和信息数据存储在元信息数据库中,再对元信息数据库中的数据进行预处理以形成规范化数据,而后调用预设的自动化标签生成规则或自动化标签生成模型以在本地创建计算容器,并通过MapReduce并行框架基于计算容器共同执行标签规则或算法以为规范化数据生成对应的标签,如此,实现多源异构电力大数据的标签技术,面向设备标签和用户标签,为电力监控和智能分析提供业务化和智能化的标签服务和应用展示。
-
-
-
-
-
-