关键词提取方法、装置及存储介质

    公开(公告)号:CN111079422A

    公开(公告)日:2020-04-28

    申请号:CN201911282700.3

    申请日:2019-12-13

    Abstract: 本公开是关于一种关键词提取方法、装置及存储介质,包括:接收原始文档,从原始文档中提取多个候选短语,所提取的多个候选短语构成候选集合;获取候选集合中每个候选短语与原始文档的关联度;获取候选集合中每个候选短语的发散度;基于关联度和发散度,从候选集合中选择至少一个候选短语作为关键短语,基于所选择的至少一个关键短语构成原始文档的关键短语集合。这样,能从候选集合选取与原始文档的关联度高的候选短语作为关键短语,使提取的关键短语与原始文档的相似性高,提高提取关键短语的准确性;能从候选集合中选发散度高的短语作为关键短语,使提取的关键短语与已选至关键短语集合的关键短语的差异程度高,提高关键短语的多样性。

    关键词提取方法、装置及存储介质

    公开(公告)号:CN111079422B

    公开(公告)日:2023-07-14

    申请号:CN201911282700.3

    申请日:2019-12-13

    Abstract: 本公开是关于一种关键词提取方法、装置及存储介质,包括:接收原始文档,从原始文档中提取多个候选短语,所提取的多个候选短语构成候选集合;获取候选集合中每个候选短语与原始文档的关联度;获取候选集合中每个候选短语的发散度;基于关联度和发散度,从候选集合中选择至少一个候选短语作为关键短语,基于所选择的至少一个关键短语构成原始文档的关键短语集合。这样,能从候选集合选取与原始文档的关联度高的候选短语作为关键短语,使提取的关键短语与原始文档的相似性高,提高提取关键短语的准确性;能从候选集合中选发散度高的短语作为关键短语,使提取的关键短语与已选至关键短语集合的关键短语的差异程度高,提高关键短语的多样性。

    神经网络的训练方法、图像识别方法及其装置

    公开(公告)号:CN110889489A

    公开(公告)日:2020-03-17

    申请号:CN201911088011.9

    申请日:2019-11-08

    Abstract: 本公开是关于一种神经网络的训练方法、图像识别方法及其装置。其中神经网络的训练方法,神经网络包括特征提取网络和分类网络,方法包括:超参数确定步骤及网络训练步骤;其中,超参数确定步骤包括:设置分类网络的超参数;基于训练样本集训练分类网络,其中训练样本集包括多个样本和样本对应的标准分类;及,判断分类网络是否达到第一训练标准,若达到第一训练标准,保存分类网络并执行网络训练步骤;若未达到第一训练标准,则返回重新设置分类网络的超参数;网络训练步骤包括:基于训练样本集训练神经网络。通过少量样本确定神经网络的超参数,再训练,在保证神经网络准确率基础上,降低训练样本标注数据量的需求,提升调优速度。

Patent Agency Ranking