-
公开(公告)号:CN110119882A
公开(公告)日:2019-08-13
申请号:CN201910296002.2
申请日:2019-04-12
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种平台风险监控方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的风险指数评估模型;从所述业务数据中获取风险点类别信息;利用所述风险指数评估模型,对所述风险点类别信息进行风险评估,得到所述风险点类别信息的风险指数评估结果。该方法可以缓解单靠人力对每个融资平台的风险进行有效监控的难度,达到了提高平台风险监控效率的技术效果。
-
公开(公告)号:CN113051918A
公开(公告)日:2021-06-29
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06K9/62 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN111026866B
公开(公告)日:2020-10-23
申请号:CN201911019149.3
申请日:2019-10-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F40/289
Abstract: 本发明公开了一种面向领域的文本信息抽取聚类方法、设备和存储介质。该方法包括:获取文本信息集合;所述文本信息集合包括:目标领域内的多个文本信息和目标领域外的多个文本信息;将所述文本信息集合输入预先训练的抽取聚类模型;通过所述抽取聚类模型对所述文本信息集合执行抽取和聚类处理,得到所述目标领域内每个主题对应的代表性信息。本发明将抽取和聚类融合在一起,使得抽取和聚类相互支撑,在抽取聚类过程中,人工干预少且抽取和聚类高效。
-
公开(公告)号:CN111026866A
公开(公告)日:2020-04-17
申请号:CN201911019149.3
申请日:2019-10-24
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/35 , G06F40/289
Abstract: 本发明公开了一种面向领域的文本信息抽取聚类方法、设备和存储介质。该方法包括:获取文本信息集合;所述文本信息集合包括:目标领域内的多个文本信息和目标领域外的多个文本信息;将所述文本信息集合输入预先训练的抽取聚类模型;通过所述抽取聚类模型对所述文本信息集合执行抽取和聚类处理,得到所述目标领域内每个主题对应的代表性信息。本发明将抽取和聚类融合在一起,使得抽取和聚类相互支撑,在抽取聚类过程中,人工干预少且抽取和聚类高效。
-
公开(公告)号:CN109783778B
公开(公告)日:2020-10-23
申请号:CN201811577909.8
申请日:2018-12-20
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/194 , G06F40/289
Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。
-
公开(公告)号:CN113051918B
公开(公告)日:2024-05-14
申请号:CN201911368962.1
申请日:2019-12-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F18/214 , G06F18/25 , G06N20/20
Abstract: 本发明公开了一种基于集成学习的命名实体识别方法、装置、设备和介质。该方法包括:将待识别的文本序列输入预先集成训练的命名实体识别模型;在命名实体识别模型中集成有多个基学习器并且每个基学习器对应一个权重;通过多个基学习器分别对输入的文本序列执行命名实体识别,得到每个基学习器输出的初始识别结果;根据每个基学习器输出的初始识别结果以及每个基学习器对应的权重,确定并输出文本序列的最终识别结果。本发明在命名实体识别模型中集成多个基学习器,并且集成训练多个基学习器,这使得命名实体识别模型的复杂度较低,降低了命名实体识别的耗时,提升了命名实体识别的时效性,也使得模型的训练过程简单易行。
-
公开(公告)号:CN109783778A
公开(公告)日:2019-05-21
申请号:CN201811577909.8
申请日:2018-12-20
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本发明实施例涉及一种文本溯源方法、设备及存储介质,所述方法包括:根据待判定文本和源文本生成词袋模型,所述源文本包括多个文本;利用多种预设的相似度算法,分别对所述词袋模型进行相似度计算,确定在不同相似度算法的情况下,所述源文本中多个文本与所述待判定文本的多个第一相似度排序;基于第一公式和所述第一相似度排序确定所述源文本源文本中多个文本与所述待判定文本的第二相似度排序;基于所述第二相似度排序从所述源文本中选择符合同源条件的文本作为所述待判定文本的同源文本,采用多种相似度的算法,可以弥补单一算法的不足,减少因计算方式不同带来的偶然性,提升计算结果的全面性和准确性。
-
公开(公告)号:CN110135693A
公开(公告)日:2019-08-16
申请号:CN201910296003.7
申请日:2019-04-12
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种风险识别方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用预设风险规则从业务数据中提取风险关联数据;利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险关联数据的风险点类别信息。该方法可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
-
-
-
-
-
-
-