兴趣主题生成方法、装置、设备及存储介质

    公开(公告)号:CN111694951B

    公开(公告)日:2023-08-01

    申请号:CN201910200002.8

    申请日:2019-03-15

    Abstract: 本发明实施例公开了一种兴趣主题生成方法、装置、设备及存储介质。所述方法包括:对目标垂类中包括的各标签词进行聚类,得到至少两个标签簇;根据至少两个标签簇中包括的各标签词信息,生成目标垂类的兴趣主题。采用本实施例的技术方案可以对任一垂类中包含的各个标签词进行聚类,以将各个标签词划分到不同的标签簇中,进而可以自动依据各个标签簇中的各标签词信息,生成得到该垂类的兴趣主题,在生成过程中不需要依赖人工操作就可以生成丰富的兴趣主题和能及时得到支撑兴趣主题的标签词,提高了垂类中兴趣主题的覆盖率和时效性。

    网络意见领袖识别方法及装置

    公开(公告)号:CN111177526A

    公开(公告)日:2020-05-19

    申请号:CN201811339804.9

    申请日:2018-11-12

    Abstract: 本发明实施例提供一种网络意见领袖识别方法及装置,属于网络领域。所述方法包括:对数据源的用户的行为数据进行关系抽取以得到用户之间的关系数据;根据所述关系数据计算预定的网络指标,其中,所述网络指标是用于表征关系数据中用户的重要性的指标;对所述数据源的所述用户的所述行为数据进行主题分类;以及根据计算出的所述网络指标和所述主题分类确定所述用户针对不同主题分类的意见领袖分数,以识别针对不同主题的意见领袖。通过将主题类型与用户的意见领袖分数相关联,使得能够快速、准确地识别出针对特定主题分类的意见领袖。

    用于分类数据的方法和装置

    公开(公告)号:CN107229731A

    公开(公告)日:2017-10-03

    申请号:CN201710427453.6

    申请日:2017-06-08

    Inventor: 戴明洋

    CPC classification number: G06F17/30705 G06F17/2745 G06F17/277 G06F17/30699

    Abstract: 本申请公开了用于分类数据的方法和装置。方法的一具体实施方式包括:采用各预定类别的初始过滤词集合,过滤原始数据,得到各预定类别的原始样本集合;对原始样本集合进行分类处理,得到验证的准确率满足阈值的更新后的样本集合;其中,分类处理包括:对原始样本集合进行过滤处理,得到更新后的样本集合,对更新后的样本集合进行验证,得到验证的准确率,响应于验证的准确率不满足阈值,对原始样本集合进行分类处理直至准确率满足阈值。该实施方式自动的学习计算出准确率满足阈值的更新后的样本集合,提高了更新后的样本集合的准确率,增强了对于未知样本的分类能力。

    兴趣主题生成方法、装置、设备及存储介质

    公开(公告)号:CN111694951A

    公开(公告)日:2020-09-22

    申请号:CN201910200002.8

    申请日:2019-03-15

    Abstract: 本发明实施例公开了一种兴趣主题生成方法、装置、设备及存储介质。所述方法包括:对目标垂类中包括的各标签词进行聚类,得到至少两个标签簇;根据至少两个标签簇中包括的各标签词信息,生成目标垂类的兴趣主题。采用本实施例的技术方案可以对任一垂类中包含的各个标签词进行聚类,以将各个标签词划分到不同的标签簇中,进而可以自动依据各个标签簇中的各标签词信息,生成得到该垂类的兴趣主题,在生成过程中不需要依赖人工操作就可以生成丰富的兴趣主题和能及时得到支撑兴趣主题的标签词,提高了垂类中兴趣主题的覆盖率和时效性。

    用户属性区分方法、装置、设备及计算机可读介质

    公开(公告)号:CN111125498A

    公开(公告)日:2020-05-08

    申请号:CN201811278701.6

    申请日:2018-10-30

    Abstract: 本发明提出一种用户属性区分方法、装置、设备和计算机可读介质,所示方法包括:推送不同类别的资讯至用户;接收用户的资讯点击数据,获取各个类别的重度用户和负反馈用户;所述重度用户为对推送的资讯的点击频次或频率大于设定阈值的用户,所述负反馈用户为对推送的资讯的点击频次或频率小于设定阈值的用户;对每个类别的重度用户和负反馈用户进行差异分析,获取每个类别的重度用户的类别属性。本发明实施例可以有效地分析某个类别特别倾向的用户群体的属性特点,更能突出群体的共性特点,能够区分真正喜欢以及真正不喜欢的人群的差异。

    基于文本的问题答案生成方法、装置、设备及存储介质

    公开(公告)号:CN119739835A

    公开(公告)日:2025-04-01

    申请号:CN202411854942.6

    申请日:2024-12-16

    Abstract: 本公开提供了基于文本的问题答案生成方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及人工智能、深度学习、大模型和检索增强生成RAG等技术领域。具体实现方案为:从缓存数据库中,获取到目标文本中的第一子内容的第一缓存令牌序列,其中,目标文本为基于待回答问题所确定出的文本;基于第一缓存令牌序列,得到目标文本的第一目标令牌序列;以及,得到待回答问题的第二目标令牌序列;至少基于第一目标令牌序列和第二目标令牌序列进行模型推理,以得到针对待回答问题的目标答案。

Patent Agency Ranking