-
公开(公告)号:CN117521656B
公开(公告)日:2024-05-07
申请号:CN202311629250.7
申请日:2023-11-30
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06F40/30 , G06N3/0455 , G06N3/0442 , G06N3/047 , G06N3/088 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种面向中文文本的端到端中文实体关系联合抽取方法,包括优化中文预训练模型,对输入的中文文本进行编码处理,生成中文文本的文本表示;对中文文本的文本表示进行实体解码处理,得到实体BIO标注序列和上下文表示向量;采用上下文注意力机制确定上下文注意力向量;将上下文注意力向量与中文文本的文本表示拼接后进行关系编码处理,得到关系编码表示;采用双仿射注意力机制进行关系解码处理,得到实体关系抽取结果。本发明能够捕捉到词级别的交叉依赖信息,能有效提升模型准确性和鲁棒性。
-
公开(公告)号:CN119782861A
公开(公告)日:2025-04-08
申请号:CN202411861898.1
申请日:2024-12-17
Applicant: 成都信息工程大学
IPC: G06F18/2321 , G06F16/22
Abstract: 本发明提供了一种面向海量数据的聚类方法及系统,涉及数据技术领域,该方法包括将空间进行网格划分,并将所有数据点分配至对应的网格内,并创建边长为网格结构一半的子网格结构;构建网格索引并检索网格的邻居;在子网格结构中,通过对每个数据点的邻域进行遍历并计算距离,对海量数据的核心点进行识别;根据海量数据的核心点识别结果,进行核心网格的合并以及分配非核心点,完成面向海量数据的快速聚类。本发明解决了传统基于密度的聚类算法无法实现对海量规模数据集进行处理(特别是在参数MinPts较大时)的问题。
-
公开(公告)号:CN117521656A
公开(公告)日:2024-02-06
申请号:CN202311629250.7
申请日:2023-11-30
Applicant: 成都信息工程大学
IPC: G06F40/295 , G06F40/30 , G06N3/0455 , G06N3/0442 , G06N3/047 , G06N3/088 , G06N3/0464 , G06N3/0985
Abstract: 本发明公开了一种面向中文文本的端到端中文实体关系联合抽取方法,包括优化中文预训练模型,对输入的中文文本进行编码处理,生成中文文本的文本表示;对中文文本的文本表示进行实体解码处理,得到实体BIO标注序列和上下文表示向量;采用上下文注意力机制确定上下文注意力向量;将上下文注意力向量与中文文本的文本表示拼接后进行关系编码处理,得到关系编码表示;采用双仿射注意力机制进行关系解码处理,得到实体关系抽取结果。本发明能够捕捉到词级别的交叉依赖信息,能有效提升模型准确性和鲁棒性。
-
-