-
公开(公告)号:CN115952261A
公开(公告)日:2023-04-11
申请号:CN202211583589.3
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F16/332 , G06F16/33 , G06F40/30 , G06N3/0455 , G06N3/08
Abstract: 本发明提供了一种基于多任务学习的生成式阅读理解方法,所述方法包括如下步骤:获取目标问题和目标段落,获取目标问题和目标段落的对应的特征向量,将特征向量输入到目标阅读理解模型,获取目标答案;从而提高目标答案的准确性和可靠性。
-
公开(公告)号:CN113553839A
公开(公告)日:2021-10-26
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN114936282B
公开(公告)日:2024-06-11
申请号:CN202210470144.8
申请日:2022-04-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F18/24 , G06F18/23 , G06F18/214 , G06N3/04 , G06Q10/0635 , G06Q40/00
Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。
-
公开(公告)号:CN115660796A
公开(公告)日:2023-01-31
申请号:CN202211577616.6
申请日:2022-12-09
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开涉及一种迁出风险企业的税源管理方法、装置、设备及存储介质,涉及数据分析技术领域,迁出风险企业的税源管理方法包括:获取目标企业的经营数据;对经营数据进行特征提取处理,得到目标企业与企业迁出行为相关的特征;将特征输入预设的企业迁出风险监控模型,基于企业迁出风险监控模型,对目标企业进行迁出风险检测。本公开实施例可以通过预设的企业迁出风险监控模型对存在迁出风险的企业进行精准稳定地的识别与预警,无需依靠人为经验,缩短企业迁出风险税前监控的时间,提高对重点税源流失预警响应的时效性和准确性。
-
公开(公告)号:CN115952801A
公开(公告)日:2023-04-11
申请号:CN202211724914.3
申请日:2022-12-28
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/295 , G06F40/289 , G06F16/33
Abstract: 本发明提供了一种企业名称对齐方法,包括:获取目标文本信息中的企业代称,以及与所述企业代称相关的关联地域实体和关联人物实体;获取所述企业代称中的构成要素,并基于获取的构成要素获取所述企业代称对应的企业简称集合,所述构成要素包括商号、地域、行业和机构类型中的至少一个;基于所述企业代称和对应的企业简称集合,获取与所述企业代称相关的候选企业信息列表,所述候选企业信息列表中包括n个候选企业信息,所述候选企业信息至少包括对应候选企业的企业名称;基于所述n个候选企业信息,获取与所述企业代称相关的目标企业名称。本发明还提供一种电子设备和存储介质。本发明能够提高企业名称对齐的准确率。
-
公开(公告)号:CN113553839B
公开(公告)日:2024-05-10
申请号:CN202010340711.9
申请日:2020-04-26
Applicant: 北京中科闻歌科技股份有限公司
IPC: G06F40/279 , G06F40/194
Abstract: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN114936282A
公开(公告)日:2022-08-23
申请号:CN202210470144.8
申请日:2022-04-28
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本公开实施例涉及一种金融风险线索确定方法、装置、设备和介质。该方法包括:获取待分类文本,并对待分类文本进行分词处理,得到各目标词语;基于各目标词语和目标词向量索引表,生成待分类文本对应的第一融合词向量组合;其中,目标词向量索引表基于初始文本样本集和预设向量转换算法预先构建,初始文本样本集为文本分类模型的训练样本集,预设向量转换算法用于将文本转换为多级别的词向量;将第一融合词向量组合输入文本分类模型,并根据模型输出结果确定待分类文本的目标文本类型;基于目标文本类型确定待分类文本是否为金融分线线索。通过上述技术方案,有效地提升了文本分类速度,进而提升线上金融业务中违规行为信息的发现效率。
-
公开(公告)号:CN110135693A
公开(公告)日:2019-08-16
申请号:CN201910296003.7
申请日:2019-04-12
Applicant: 北京中科闻歌科技股份有限公司
Abstract: 本申请涉及一种风险识别方法、装置、设备及存储介质,该方法包括:获取与业务数据对应的预设风险规则和风险分析模型;利用预设风险规则从业务数据中提取风险关联数据;利用风险分析模型对提取到的风险关联数据进行风险点识别,得到风险关联数据的风险点类别信息。该方法可以缓解单靠人力对每个融资平台的风险进行有效识别的难度,达到了提高平台风险识别效率的技术效果。
-
-
-
-
-
-
-