网络社交平台隐私甄别方法、系统、存储介质和计算机

    公开(公告)号:CN109739976A

    公开(公告)日:2019-05-10

    申请号:CN201811451898.9

    申请日:2018-11-30

    Inventor: 曹娟 郭俊波 谢添

    Abstract: 本发明涉及一种网络社交平台隐私甄别方法、系统、存储介质和计算机,包括:根据网络社交平台已发布的问题及相关答案之间的结构特征,构建由多组分析数据构成的训练样本集,分析数据包括:问题信息、相关的答案列表信息以及对应的隐私性标签;以训练样本集中的问题信息、相关的答案列表信息为输入,以对应的隐私性标签为输出,训练深度学习模型得到基于深度学习模型的隐私信息甄别模型;获取社交网络平台上发布的问题信息,作为待甄别信息,将待甄别信息和与待甄别信息相关的答案列表信息输入到隐私信息甄别模型,得到待甄别信息的隐私性标签作为隐私甄别结果。

    一种面向用户生成内容的分布式采集方法与系统

    公开(公告)号:CN104735138B

    公开(公告)日:2018-01-09

    申请号:CN201510102980.0

    申请日:2015-03-09

    Abstract: 本发明提供一种面向用户生成内容的分布式采集方法,包括:1)根据采集页面的采集量和采集难度划分页面类型,基于页面类型构建采集任务并将其加入采集队列;其中,所述采集任务包括复合采集任务,所述复合采集任务根据采集量和采集难度将多个同类型的采集页面划入;2)并发地从所述采集任务队列取出采集任务,执行该采集任务并返回所采集的信息。本发明还提供了相应的分布式采集系统,包括主控节点和多个子节点,主控节点用于构建并维护采集任务队列;各个所述子节点用于并发地执行采集任务。本发明的采集速度快,显著地提高了UGC新闻采集的实时性;可以适用于各种不同类型页面的采集,执行多样化的采集任务;能够规避采集对象的监控措施。

    新闻线索个性化推送方法及系统

    公开(公告)号:CN106484733A

    公开(公告)日:2017-03-08

    申请号:CN201510550175.4

    申请日:2015-09-01

    CPC classification number: G06F16/9535 G06F16/951

    Abstract: 本申请公开一种新闻线索个性化推送方法及系统,该方法包括:步骤1,创建新闻线索领域的标签,为每个新闻线索领域分别训练一个新闻线索分类模型,使用所述新闻线索分类模型来对新闻线索候选集中的每条新闻线索进行分类,并存入对应领域的新闻线索集;步骤2,基于线索热度、时效性、和可信度建立新闻线索评分模型来对每个所述线索集中的每条新闻线索进行评分,选择得分最高的N条线索作为待推荐线索;步骤3,由用户从所述标签中选择自己感兴趣的新闻线索领域,然后将对应于所选兴趣领域的待推荐线索推送给用户。由此,能够根据用户群特点快速准确的从候选新闻线索集中找到用户需要的有价值的线索并进行推送。

    一种微博信息采集方法及系统

    公开(公告)号:CN103399968A

    公开(公告)日:2013-11-20

    申请号:CN201310298119.7

    申请日:2013-07-16

    Abstract: 本发明提供一种微博信息采集方法及系统,所述方法包括:根据用户提交的查询确定信息类型以及页面链接参数;向微博服务器发送根据所述信息类型和所述页面链接参数构造的页面请求链接,抽取返回页面中的基础信息数据项。所述方法还包括:并行执行信息所在页面的相关信息采集。本发明提供的微博信息采集方法和系统在提高信息采集效率的同时,可以获取更完整的微博信息。

    网络视频话题检测的方法及其系统

    公开(公告)号:CN101887459B

    公开(公告)日:2012-07-11

    申请号:CN201010221077.3

    申请日:2010-06-28

    Abstract: 本发明一种网络视频话题检测的方法及系统,方法包括:步骤1,将视频的标签词表示为时间轴上的词频变化轨迹,根据该词频变化轨迹提取每个时间单元内的显著词;步骤2,将每个时间单元内的显著词表示为所述时间单元内上传的所有视频的倒排索引,并对所述显著词进行聚类,一个类为所述时间单元的一个事件;步骤3,计算各个事件之间相似度,建立事件之间的连接,形成事件发展轨迹图,事件发展轨迹图中的点为事件,按两个事件之间的相似度连接点生成边;步骤4,将事件发展轨迹图分割为多个连通子图;步骤5,按预设标准从各个连通子图中查找最优路径,每条最优路径对应一个话题的轨迹,进而完成话题的检测。本发明能够从网络中检测出视频话题。

Patent Agency Ranking