数据挖掘的方法和装置
    12.
    发明公开

    公开(公告)号:CN105653538A

    公开(公告)日:2016-06-08

    申请号:CN201410642239.9

    申请日:2014-11-13

    Abstract: 一种数据挖掘的方法,包括以下步骤:获取各个用户的行为序列,所述行为序列中包含多条按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。上述方法可挖掘出准确的用户行为频率提升因素。此外,还提供一种数据挖掘的装置。

    面向多级标签的文本分类方法、装置、设备及存储介质

    公开(公告)号:CN114691866A

    公开(公告)日:2022-07-01

    申请号:CN202210225366.3

    申请日:2022-03-09

    Abstract: 本公开实施例涉及一种面向多级标签的文本分类方法、装置、设备及存储介质。本公开实施例通过获取文本以及文本中关键词对应的标签;基于预设的面向多级标签的文本分类模型中的文本编码模型对文本进行编码处理,得到文本的特征向量,文本的特征向量对文本的关键词进行敏感表征,基于预设的面向多级标签的文本分类模型中的标签编码模型,对标签进行编码处理,得到标签的向量;分别计算文本的特征向量与每个标签的向量之间的余弦相似度;将余弦相似度大于预设阈值的标签确定为文本的标签。通过对文本和现有类别标签进行编码处理和余弦相似度计算处理,选择出文本内容相匹配的标签,可减轻对人工标注标签的依赖,降低人工标注和标签体系的维护成本,提高标签标注的准确率,使文本分类结果更准确。

    数据挖掘的方法和装置
    15.
    发明授权

    公开(公告)号:CN105653538B

    公开(公告)日:2019-12-20

    申请号:CN201410642239.9

    申请日:2014-11-13

    Abstract: 一种数据挖掘的方法,包括以下步骤:获取各个用户的行为序列,所述行为序列中包含多条按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。上述方法可挖掘出准确的用户行为频率提升因素。此外,还提供一种数据挖掘的装置。

    一种结合推理和半自动学习的行为知识提取方法和装置

    公开(公告)号:CN103455638A

    公开(公告)日:2013-12-18

    申请号:CN201310452292.8

    申请日:2013-09-26

    Abstract: 本发明提出一种结合推理和半自动学习的行为知识提取方法和装置。本发明针对海量的开源文本,使用少量行为知识提取模板并利用行为知识间的语义关联,增量地从文本中获取行为前提、行为结果和行为间的时序关系三种主要的行为知识。本发明基于Bootstrapping分别获取上述三种行为知识,并基于行为知识间的语义关联,在Bootstrapping步骤中结合知识推理进行行为知识提取。本发明能够有效提高了行为知识提取的效率和质量,可在不同应用领域支持面向海量文本的行为自动建模和分析。

Patent Agency Ranking