一种基于互联网公开数据的企业关联信息挖掘方法

    公开(公告)号:CN117909559B

    公开(公告)日:2024-08-20

    申请号:CN202410170696.6

    申请日:2024-02-06

    Abstract: 本发明属于数据挖掘领域,提出了一种基于互联网公开数据的企业关联信息挖掘方法,通过搜索引擎自动搜索目标企业相关信息,获取特征信息,采集目标企业互联网公开数据,使用NLP技术处理采集的互联网公开数据,挖掘企业间关联关系,并分别从面向标题和面向段落的企业实体识别规则进行分阶段的提取,其对面向标题的企业实体识别规则中添加了价值判断,实现了自动且准确的从互联网采集数据中发掘企业关联信息,最大程度的解决了现有企业关联信息获取方法中存在的个人主观因素影响较大、特定站点数据不够全面、验证环节困难等问题。

    一种互联网文档的总访问量的估值方法

    公开(公告)号:CN114357347A

    公开(公告)日:2022-04-15

    申请号:CN202111621632.6

    申请日:2021-12-28

    Abstract: 本发明涉及一种互联网文档的总访问量的估值方法。包括:基于网站、app、社交媒体的日平均访问量,分别构建网站、app以及社交媒体的计算模型;获取用户首发的原创互联网文档并进行初始化分析;根据计算模型分别预估访问量;对所述网站预估访问量、app预估访问量以及社交媒体访预估问量,这三个值进行求和获得当日全网总访问量,再根据发布时间t获得衰减比例,获得已发布t天数内的总访问量。本发明针对互联网中的网站、app、社交媒体为基础全面的进行估算;构建不同的模型及实现算法,同时通过校正系数、配比等分析,客观准确的在全网进行总访问量的估值,为更有效的评估网站影响力、统计效绩及通过客观性排名等需求提供更有力的数据支持。

    一种基于提示学习的海关税收风险知识抽取方法

    公开(公告)号:CN118296134B

    公开(公告)日:2024-08-09

    申请号:CN202410718893.7

    申请日:2024-06-05

    Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。

    一种互联网文档的总访问量的估值方法

    公开(公告)号:CN114357347B

    公开(公告)日:2024-04-26

    申请号:CN202111621632.6

    申请日:2021-12-28

    Abstract: 本发明涉及一种互联网文档的总访问量的估值方法。包括:基于网站、app、社交媒体的日平均访问量,分别构建网站、app以及社交媒体的计算模型;获取用户首发的原创互联网文档并进行初始化分析;根据计算模型分别预估访问量;对所述网站预估访问量、app预估访问量以及社交媒体预估访问量,这三个值进行求和获得当日全网总访问量,再根据发布时间t获得衰减比例,获得已发布t天数内的总访问量。本发明针对互联网中的网站、app、社交媒体为基础全面的进行估算;构建不同的模型及实现算法,同时通过校正系数、配比等分析,客观准确的在全网进行总访问量的估值,为更有效的评估网站影响力、统计效绩及通过客观性排名等需求提供更有力的数据支持。

    一种基于互联网公开数据的企业关联信息挖掘方法

    公开(公告)号:CN117909559A

    公开(公告)日:2024-04-19

    申请号:CN202410170696.6

    申请日:2024-02-06

    Abstract: 本发明属于数据挖掘领域,提出了一种基于互联网公开数据的企业关联信息挖掘方法,通过搜索引擎自动搜索目标企业相关信息,获取特征信息,采集目标企业互联网公开数据,使用NLP技术处理采集的互联网公开数据,挖掘企业间关联关系,并分别从面向标题和面向段落的企业实体识别规则进行分阶段的提取,其对面向标题的企业实体识别规则中添加了价值判断,实现了自动且准确的从互联网采集数据中发掘企业关联信息,最大程度的解决了现有企业关联信息获取方法中存在的个人主观因素影响较大、特定站点数据不够全面、验证环节困难等问题。

    一种基于提示学习的海关税收风险知识抽取方法

    公开(公告)号:CN118296134A

    公开(公告)日:2024-07-05

    申请号:CN202410718893.7

    申请日:2024-06-05

    Abstract: 本发明涉及海关数据处理技术领域,提出了一种基于提示学习的海关税收风险知识抽取方法,建立海关风险知识抽取的数据源:输入通用预训练命名实体识别模型抽取企业实体名称,并利用依存句法优化实体命名结果,得到候选名称;将候选名称放入提示学习语言模型进行验证,输出概率最高的企业实体名称;再进行风险评价提取:基于预训练语言模型的提示学习来对报道正负面做文本分类预测;最后将提取出企业实体名称、风险评价信息进行特征融合,并录入海关报关单数据库。提高实体命名识别的准确性,并解决了对海关风险信息领域的样本信息少,抽取任务准确率低的问题。

Patent Agency Ranking