数据识别模型的训练方法、装置及存储介质

    公开(公告)号:CN108537289B

    公开(公告)日:2023-04-07

    申请号:CN201810374080.5

    申请日:2018-04-24

    Abstract: 本发明提出一种数据识别模型的训练方法、装置及存储介质,数据识别模型包括:多层识别逻辑,该方法包括确定第一数据基于不同识别逻辑下的预设指标的实际值,得到与每层识别逻辑对应的实际值,其中,第一数据为海量的评论数据;根据实际值确定是否需要对初始的数据识别模型进行迭代训练;在确定需要进行迭代训练时,获取初始的数据识别模型的训练数据集,训练数据集用于对数据识别模型进行初始的训练;按照预设策略,根据第一数据对训练数据集进行更新,得到新数据集,并根据新数据集对初始的数据识别模型进行自动化迭代训练。通过本发明能够结合海量的评论数据实现数据识别模型的自动化迭代更新训练,释放人力成本,提升模型识别精准度。

    用于识别文本类型的方法、装置和设备

    公开(公告)号:CN107797982B

    公开(公告)日:2021-05-07

    申请号:CN201610798213.2

    申请日:2016-08-31

    Abstract: 本申请公开了用于识别文本类型的方法、装置和设备。所述方法的一具体实施方式包括:对预先获取的文本进行预处理得到所述文本的关键词集合;计算所述关键词集合中的每个关键词在所述文本中的出现概率值;对于所述关键词集合中的每个关键词,将该关键词和与该关键词对应的出现概率值导入预先建立的文档主题生成模型,确定所述文档主题生成模型中预先设置的各个主题在所述文本的出现概率值;根据所述各个主题在所述文本中的出现概率值,识别所述文本所属的类型。该实施方式提高了识别文本类型的准确率。

    一种获取舆情数据的方法和装置

    公开(公告)号:CN107544988B

    公开(公告)日:2021-03-19

    申请号:CN201610482038.6

    申请日:2016-06-27

    Abstract: 本发明提供了一种获取舆情数据的方法和装置,预先挖掘实体词库,所述实体词库包括描述所对应实体的关键词;在获取舆情数据时,从所获取的网页数据中提取关键词;将提取的关键词与各实体词库进行相似度匹配,确定相似度满足预设要求的实体词库所对应的实体;将所述网页数据作为所确定出实体的舆情数据。本发明能够自动实现舆情数据的获取,相比较人工收集舆情数据的方式,大大降低了人力成本,且提高了舆情数据的覆盖率。

    资质识别模板构建方法、装置、设备和存储介质

    公开(公告)号:CN111209909A

    公开(公告)日:2020-05-29

    申请号:CN202010033391.2

    申请日:2020-01-13

    Abstract: 本申请实施例公开了一种资质识别模板构建方法、装置、设备和存储介质,涉及数据采集技术领域。具体实现方案为:对资质样本图像进行字符识别,得到字符内容和字符位置信息;基于所述字符内容和所述字符位置信息,确定所述资质样本图像中的关键字段区域以及信息值区域;根据所述关键字段区域和所述信息值区域,构建资质识别模板。本申请实施例通过从资质样本图像中识别并抽取包括关键字段区域以及信息值区域的待识别区域,能够快速构建各类或各版本资质的资质识别模板,避免人工对资质识别模板的个性化定制等繁复流程,提高资质识别模板构建和更新效率,降低开发成本。

    一种分布式系统中用于消息传送的方法与装置

    公开(公告)号:CN104539512B

    公开(公告)日:2018-11-23

    申请号:CN201410742726.2

    申请日:2014-12-05

    Abstract: 本发明的目的是提供一种分布式系统中用于消息传送的方法和装置,该分布式系统包括多个子系统,其中包括一个第一子系统。该方法包括:各个子系统分别根据所接收的消息发送请求生成第一消息;各个子系统分别将一个或多个第一消息批量提供至所述第一子系统;所述第一子系统对所获取的来自各个子系统的一个或多个第一消息进行排序以获得经排序的一个或多个第二消息;所述第一子系统分别将排序后的所述一个或多个第二消息批量提供至各个子系统;所述各个子系统分别发送所获取的一个或多个第二消息中的各个第二消息。与现有技术相比,使用本发明,消息在跨子系统进行传送时均使用批量传送的方式,提高了消息的传送效率,并缩短了对于消息的响应时间。

    评论数据处理方法、装置及设备

    公开(公告)号:CN108550065A

    公开(公告)日:2018-09-18

    申请号:CN201810317233.2

    申请日:2018-04-10

    Abstract: 本发明提出一种评论数据处理方法、装置及设备,其中方法包括:获取待处理的目标评论数据及目标评论数据对应的用户信息;根据用户信息,确定用户的可信度;对目标评论数据进行识别处理,确定目标评论数据的可信度;根据用户的可信度及目标评论数据的可信度,确定目标评论数据所属的类型。该方法实现了根据评论数据的可信度及评论数据对应用户的可信度,对评论数据进行自动识别,不仅提高了对评论数据识别的准确性,而且提高了对评论数据识别的处理速度,降低了对评论数据处理的成本,为向用户提供可靠的评论数据提供了保障。

    数据识别模型的训练方法、装置及存储介质

    公开(公告)号:CN108537289A

    公开(公告)日:2018-09-14

    申请号:CN201810374080.5

    申请日:2018-04-24

    Abstract: 本发明提出一种数据识别模型的训练方法、装置及存储介质,数据识别模型包括:多层识别逻辑,该方法包括确定第一数据基于不同识别逻辑下的预设指标的实际值,得到与每层识别逻辑对应的实际值,其中,第一数据为海量的评论数据;根据实际值确定是否需要对初始的数据识别模型进行迭代训练;在确定需要进行迭代训练时,获取初始的数据识别模型的训练数据集,训练数据集用于对数据识别模型进行初始的训练;按照预设策略,根据第一数据对训练数据集进行更新,得到新数据集,并根据新数据集对初始的数据识别模型进行自动化迭代训练。通过本发明能够结合海量的评论数据实现数据识别模型的自动化迭代更新训练,释放人力成本,提升模型识别精准度。

    一种用于消息处理的方法及系统

    公开(公告)号:CN104917837B

    公开(公告)日:2018-05-04

    申请号:CN201510320019.9

    申请日:2015-06-11

    Abstract: 本发明公开了一种用于消息处理的方法及系统,所述方法包括:消息中间件接收发送方发起的消息推送调用,其中,所述消息推送调用的标识符为第一标识符;生成所述消息推送调用中消息的标识符作为第二标识符,将所述第一标识符作为所述第二标识符对应消息的应用程序接口API的请求字段;将所述第二标识符对应的消息移入出队列,将待推送给所述接收方的消息推送调用的标识符赋值为所述第一标识符,并将所述待推送的消息推送应用推送给所述接收方。通过采用本发明,可有效提高多个模块级联交互状态下消息追踪和处理的效率,缩短日志排查时间,降低对大型项目的理解复杂度。

Patent Agency Ranking