-
公开(公告)号:CN116932737A
公开(公告)日:2023-10-24
申请号:CN202310919742.3
申请日:2023-07-25
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/335 , G06F40/205 , G06F40/279 , G06F16/35 , G06N5/025
Abstract: 本发明公开了一种基于大数据的人物属性抽取方法,涉及信息抽取技术领域。包括以下步骤:S1、获取关联人物信息文本;S2、关联人物属性抽取识别;S3、关联人物属性分析处理;S4、关联人物行为关联;S5、关联人物属性数据的补充。通过人物属性抽取模型对属性集的增补能够提供更全面、时效性的属性信息,满足不同应用场景和用户需求的个性化要求,促进深层次的人物理解和分析,并改善决策支持和业务效果,通过使用词向量技术获取属性的同义词、相似词可提高属性抽取模型的覆盖率、准确性和灵活性,降低数据稀疏性,并支持跨语言的属性抽取。这使得模型能够更好地适应不同场景和需求,提供更全面、准确的人物属性信息。
-
公开(公告)号:CN116911704A
公开(公告)日:2023-10-20
申请号:CN202310915856.0
申请日:2023-07-25
Applicant: 中科天玑数据科技股份有限公司
IPC: G06Q10/067 , G06Q10/063 , G06Q50/00
Abstract: 本发明涉及媒体数据技术领域,且公开了一种基于社交媒体数据的候选人影响力评估方法,包括以下步骤:S1、面向候选人影响力评估任务,建立社交媒体数据体系;S2、建立基于社交媒体数据的候选人影响力评估模型。本发明通过在评估候选人影响力时,算法不仅考虑其社交网络中的连接关系,还考虑其他多个维度的因素,如用户行为、交互量、内容质量、活跃度等,通过综合考虑这些因素,可以更全面地评估人物的影响力,算法根据候选人的个人属性和动态行为信息进行评估,能够生成针对不同用户的个性化影响力排名结果,即不同用户可看到适合其个人兴趣的高影响力候选人,提供更加精准的候选人影响力计算。
-
公开(公告)号:CN113761839A
公开(公告)日:2021-12-07
申请号:CN202110484482.2
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F40/14 , G06F40/151 , G06F40/174 , G06F16/835
Abstract: 本发明公开了一种多层分组的多维统计分析方法,包括下列步骤:S1、根据表格ID参数确定待统计的表格;S2、获取上述表格中用于分组和统计的表格数据;S3、根据转换器参数Transform,对表格数据进行转换,作为步骤S4的输入;S4、构造一个树节点,作为分组和统计的根节点;S5、从根节点出发,对当前节点数据按照指定的分组器参数的字段,对数据进行分组;S6、对每个分组构造一个树节点,作为当前节点的子节点,添加到树中;S7、通过上述节点的数据,得到基于多层分组的树结构表示的表格数据。有益效果:本发明是对表格数据进行多维度统计,实现灵活可扩展的统计分析功能,可用于多种统计分析应用中。
-
公开(公告)号:CN113761121B
公开(公告)日:2023-05-09
申请号:CN202110484431.X
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/237
Abstract: 本发明公开了一种结构化数据的知识抽取方法,包括下列步骤:S1、构件抽取组件;S2、按照每条抽取规则指定的表格,构造一种字典数据结构,其中键为表格ID,值为对应表格的一组抽取组件;S3、遍历步骤S2中构造的字典,对于每个键值对,基于键构造数据库连接,获取表格数据,然后将这些数据逐条发送给当前键对应的抽取组件;S4、抽取组件对接收的数据进行处理,依次进行全局唯一ID、业务标识ID、类型、属性信息抽取;S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果:可用于构建知识图谱,有良好的扩展性和自适应能力,能够满足多源异构数据的知识抽取需要。
-
公开(公告)号:CN113761121A
公开(公告)日:2021-12-07
申请号:CN202110484431.X
申请日:2021-04-30
Applicant: 中科天玑数据科技股份有限公司
IPC: G06F16/33 , G06F16/36 , G06F40/237
Abstract: 本发明公开了一种结构化数据的知识抽取方法,包括下列步骤:S1、构件抽取组件;S2、按照每条抽取规则指定的表格,构造一种字典数据结构,其中键为表格ID,值为对应表格的一组抽取组件;S3、遍历步骤S2中构造的字典,对于每个键值对,基于键构造数据库连接,获取表格数据,然后将这些数据逐条发送给当前键对应的抽取组件;S4、抽取组件对接收的数据进行处理,依次进行全局唯一ID、业务标识ID、类型、属性信息抽取;S5、对于节点抽取组件和关系抽取组件进行进一步抽取。有益效果:可用于构建知识图谱,有良好的扩展性和自适应能力,能够满足多源异构数据的知识抽取需要。
-
-
-
-