-
公开(公告)号:CN113779996A
公开(公告)日:2021-12-10
申请号:CN202111016213.X
申请日:2021-08-31
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/295 , G06F40/216 , G06F40/126 , G06N3/04 , G06K9/62 , G16H50/70
Abstract: 本发明提供基于BiLSTM模型的标准实体文本确定方法、装置及存储介质,方法包括:针对接收到的待匹配文本实体,选取与其对应的候选实体集;针对候选实体集中的每一候选实体,分别与待匹配文本实体构成文本实体对;针对每个文本实体对,采用预设神经匹配神经网络计算文本实体对的第一相似度特征向量,及采用文本统计方法、全连接网络计算文本实体对的第二相似度特征向量;采用拼接网络将每个文本实体对的第一相似度特征向量与第二相似度特征向量拼接形成每个实体对的相似度向量,并根据每个文本实体对的相似度向量输出每个实体对中两个实体文本的相似度;将相似度最高的文本实体对中的候选文本实体确定为与待匹配文本实体对应的标准文本实体。
-
公开(公告)号:CN113779996B
公开(公告)日:2023-10-10
申请号:CN202111016213.X
申请日:2021-08-31
Applicant: 中国中医科学院中医药信息研究所
IPC: G06F40/295 , G06F40/216 , G06F40/126 , G06N3/0442 , G06N3/084 , G06N3/0464 , G06N3/045 , G06F18/22 , G16H50/70
Abstract: 本发明提供基于BiLSTM模型的标准实体文本确定方法、装置及存储介质,方法包括:针对接收到的待匹配文本实体,选取与其对应的候选实体集;针对候选实体集中的每一候选实体,分别与待匹配文本实体构成文本实体对;针对每个文本实体对,采用预设神经匹配神经网络计算文本实体对的第一相似度特征向量,及采用文本统计方法、全连接网络计算文本实体对的第二相似度特征向量;采用拼接网络将每个文本实体对的第一相似度特征向量与第二相似度特征向量拼接形成每个实体对的相似度向量,并根据每个文本实体对的相似度向量输出每个实体对中两个实体文本的相似度;将相似度最高的文本实体对中的候选实体确定为与待匹配文本实体对应的标准文本实体。
-