基于用户历史数据的移动流量套餐推荐算法

    公开(公告)号:CN105389713A

    公开(公告)日:2016-03-09

    申请号:CN201510674004.2

    申请日:2015-10-15

    Applicant: 南京大学

    CPC classification number: G06Q30/0202 G06K9/6282

    Abstract: 本发明提供一种基于用户历史消费信息并采用数据挖掘分析技术的移动用户流量套餐推荐算法。包括如下步骤:1)目标用户发现阶段:a获取已处理生成的数据集,包括训练集和预测集;b实施随机森林分类算法发现潜在流量套餐提升用户作为目标用户;c结束;2)流量套餐推荐阶段:a获取已处理生成的预测集;b实施K-means聚类算法得到粗略相似用户簇;c获取1)-b中得到的目标用户;d在同一簇中根据用户的相似度函数,为目标用户实施TopN推荐算法;e结束。本发明是基于数据挖掘的技术在移动用户中找出有潜在流量套餐提升需求的用户并对其实施推荐方案。和传统的方法相比更精确、更高效,具有实现简单、代价低等一系列的优点。

    基于词网络进行特征扩展的短文本主题模型挖掘方法

    公开(公告)号:CN106055604A

    公开(公告)日:2016-10-26

    申请号:CN201610353388.2

    申请日:2016-05-25

    Applicant: 南京大学

    Abstract: 一种基于词网络进行特征扩展的短文本主题模型挖掘方法,包括如下步骤:带权词网络构建步骤:文本预处理,对短文本语料库中的文本进行中文分词,并删除掉停用词;从中文分词后的文档中建立带权词网络,带权词网络中的节点是词语,节点之间的边是两个词语在同一篇文档中的共现关系,边的权重是在整个语料库中两个词语共现的次数;结束;短文本特征扩展步骤:将每条短文本的中文分词后包含的词语节点作为建立的带权词网络中的一个社团;主题挖掘步骤;将短文本特征扩一种基于词网络社团模块度的短文本特征稀疏性解决方法,从而解决LDA主题模型应用于短文本中效果不佳的问题。提升短文本主题模型的准确性。

    基于词网络进行特征扩展的短文本主题模型挖掘方法

    公开(公告)号:CN106055604B

    公开(公告)日:2019-08-27

    申请号:CN201610353388.2

    申请日:2016-05-25

    Applicant: 南京大学

    Abstract: 一种基于词网络进行特征扩展的短文本主题模型挖掘方法,1)带权词网络构建步骤:2)短文本特征扩展步骤:3)主题挖掘步骤:将步骤2短文本特征扩展后的语料库作为训练集进行LDA吉布斯采样;采样后获得“中文分词后的文档‑主题”分布和“主题‑带权词网络中的节点是词语词语”分布;结束;计算邻接点加入社团前后的模块度增量,模块度是衡量社团好坏的标准,指网络中连接社团内部节点的边所占的比例与另外一个随机网络中连接社团内部节点的边所占比例的期望值相减得到的差值。

    基于协同过滤推荐算法的机型推荐系统

    公开(公告)号:CN104794635A

    公开(公告)日:2015-07-22

    申请号:CN201510186307.X

    申请日:2015-04-17

    Applicant: 南京大学

    Abstract: 基于协同过滤推荐算法的手机机型推荐方法,利用协同过滤推荐算法的框架,结合机型生命周期模型和相应的打分函数来为用户精确推荐机型,包括如下步骤,包括最近邻计算阶段和机型推荐阶段:数据预处理,清除噪声和异常数据,排除不符合要求的用户和机型,从用户数据库中抽取目前正在使用的用户的个人信息和历史消费信息,从机型数据库中抽取用户目前使用机型的相关属性;利用预处理后的数据将相应的信息抽取出来为每个用户构建对应的用户向量,并使用本系统设计的方法计算用户间的相似度;计算目标用户与其他用户的相似度取相似度最大的前N个作为目标用户的最近邻居。

Patent Agency Ranking