一种基于大数据的人物属性抽取方法

    公开(公告)号:CN116932737A

    公开(公告)日:2023-10-24

    申请号:CN202310919742.3

    申请日:2023-07-25

    Inventor: 王海荣 张瑾 陈波

    Abstract: 本发明公开了一种基于大数据的人物属性抽取方法,涉及信息抽取技术领域。包括以下步骤:S1、获取关联人物信息文本;S2、关联人物属性抽取识别;S3、关联人物属性分析处理;S4、关联人物行为关联;S5、关联人物属性数据的补充。通过人物属性抽取模型对属性集的增补能够提供更全面、时效性的属性信息,满足不同应用场景和用户需求的个性化要求,促进深层次的人物理解和分析,并改善决策支持和业务效果,通过使用词向量技术获取属性的同义词、相似词可提高属性抽取模型的覆盖率、准确性和灵活性,降低数据稀疏性,并支持跨语言的属性抽取。这使得模型能够更好地适应不同场景和需求,提供更全面、准确的人物属性信息。

    一种基于社交媒体数据的候选人影响力评估方法

    公开(公告)号:CN116911704A

    公开(公告)日:2023-10-20

    申请号:CN202310915856.0

    申请日:2023-07-25

    Inventor: 王海荣 张瑾 陈波

    Abstract: 本发明涉及媒体数据技术领域,且公开了一种基于社交媒体数据的候选人影响力评估方法,包括以下步骤:S1、面向候选人影响力评估任务,建立社交媒体数据体系;S2、建立基于社交媒体数据的候选人影响力评估模型。本发明通过在评估候选人影响力时,算法不仅考虑其社交网络中的连接关系,还考虑其他多个维度的因素,如用户行为、交互量、内容质量、活跃度等,通过综合考虑这些因素,可以更全面地评估人物的影响力,算法根据候选人的个人属性和动态行为信息进行评估,能够生成针对不同用户的个性化影响力排名结果,即不同用户可看到适合其个人兴趣的高影响力候选人,提供更加精准的候选人影响力计算。

    一种多层分组的多维统计分析方法

    公开(公告)号:CN113761839A

    公开(公告)日:2021-12-07

    申请号:CN202110484482.2

    申请日:2021-04-30

    Abstract: 本发明公开了一种多层分组的多维统计分析方法,包括下列步骤:S1、根据表格ID参数确定待统计的表格;S2、获取上述表格中用于分组和统计的表格数据;S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;S4、构造一个树节点,作为分组和统计的根节点;S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据。有益效果:本发明是对表格数据进行多维度统计,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。

    一种结构化数据的知识抽取方法

    公开(公告)号:CN113761121B

    公开(公告)日:2023-05-09

    申请号:CN202110484431.X

    申请日:2021-04-30

    Abstract: 本发明公开了一种结构化数据的知识抽取方法,包括下列步骤:S1、构件抽取组件;S2、按照每条抽取规则指定的表格,构造一种字典数据结构,其中键为表格ID,值为对应表格的一组抽取组件;S3、遍历步骤S2中构造的字典,对于每个键值对,基于键构造数据库连接,获取表格数据,然后将这些数据逐条发送给当前键对应的抽取组件;S4、抽取组件对接收的数据进行处理,依次进行全局唯一ID、业务标识ID、类型、属性信息抽取;S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果:可用于构建知识图谱,有良好的扩展性和自适应能力,能够满足多源异构数据的知识抽取需要。

    一种结构化数据的知识抽取方法

    公开(公告)号:CN113761121A

    公开(公告)日:2021-12-07

    申请号:CN202110484431.X

    申请日:2021-04-30

    Abstract: 本发明公开了一种结构化数据的知识抽取方法,包括下列步骤:S1、构件抽取组件;S2、按照每条抽取规则指定的表格,构造一种字典数据结构,其中键为表格ID,值为对应表格的一组抽取组件;S3、遍历步骤S2中构造的字典,对于每个键值对,基于键构造数据库连接,获取表格数据,然后将这些数据逐条发送给当前键对应的抽取组件;S4、抽取组件对接收的数据进行处理,依次进行全局唯一ID、业务标识ID、类型、属性信息抽取;S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果:可用于构建知识图谱,有良好的扩展性和自适应能力,能够满足多源异构数据的知识抽取需要。

Patent Agency Ranking