-
公开(公告)号:CN114548088B
公开(公告)日:2024-11-26
申请号:CN202210066022.2
申请日:2022-01-20
Applicant: 中国地质大学(武汉)
IPC: G06F40/279 , G06F16/28 , G06F40/216 , G06F40/30 , G06N3/0464 , G06N3/08 , G06N3/049
Abstract: 本发明涉及地质文本分析领域,提供一种地质文本实体关系联合抽取方法及系统,包括:S1:获得句子文本集;S2:获得筛选后的句子文本集;S3:获得各句子的词向量;获得各句子的词标签;获得依存关系树;S4:获得每个词联系上下文的连续嵌入表示;S5:获得每个词当前时间步的包含上下文信息的隐藏层状态向量;S6:获得包含丰富邻域信息和语义特征的词向量表示;S7:获得训练好的提取模型;S8:将所述测试样本集输入所述训练好的提取模型,获得所述测试样本集的实体间关系的三元组。本发明使大量非结构化数据得以有效利用,并且可以通过训练大量数据自动获取模型,而不需要人工提取特征,节省了大量时间与人工成本。
-
公开(公告)号:CN114548088A
公开(公告)日:2022-05-27
申请号:CN202210066022.2
申请日:2022-01-20
Applicant: 中国地质大学(武汉)
IPC: G06F40/279 , G06F16/28 , G06F40/216 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本发明涉及地质文本分析领域,提供一种地质文本实体关系联合抽取方法及系统,包括:S1:获得句子文本集;S2:获得筛选后的句子文本集;S3:获得各句子的词向量;获得各句子的词标签;获得依存关系树;S4:获得每个词联系上下文的连续嵌入表示;S5:获得每个词当前时间步的包含上下文信息的隐藏层状态向量;S6:获得包含丰富邻域信息和语义特征的词向量表示;S7:获得训练好的提取模型;S8:将所述测试样本集输入所述训练好的提取模型,获得所述测试样本集的实体间关系的三元组。本发明使大量非结构化数据得以有效利用,并且可以通过训练大量数据自动获取模型,而不需要人工提取特征,节省了大量时间与人工成本。
-