-
公开(公告)号:CN114692601A
公开(公告)日:2022-07-01
申请号:CN202011572938.2
申请日:2020-12-25
申请人: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC分类号: G06F40/211 , G06F40/279 , G06F16/31 , G06F16/33 , G06F16/35
摘要: 本发明实施例涉及一种信息抽取方法、装置、电子设备及存储介质,包括:利用预设规则从至少一个信息通道中获取目标事件的相关文本;对所述相关文本进行分割,得到多个句子;对每一所述句子进行句法分析,根据句法分析结果得到所述句子中的目标专家实体和目标发言指示词;根据所述目标专家实体和目标发言指示词从所述句子中抽取目标专家职称和目标专家观点。由此,可以实现从互联网的海量信息中抽取出专家对于特定事件的观点。
-
公开(公告)号:CN114461953A
公开(公告)日:2022-05-10
申请号:CN202011243214.3
申请日:2020-11-09
申请人: 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司 , 深圳中科闻歌科技有限公司
IPC分类号: G06F16/958 , G06F16/955
摘要: 本发明实施例涉及一种网站监管方法、装置、电子设备及存储介质,包括:从目标网站的网页源码中提取重定向统一资源定位符URL;获取所述重定向URL所指向的网页;将所述重定向URL进行向量化表示得到第一向量,以及将所述网页进行向量化表示得到第二向量;根据所述第一向量和所述第二向量确定所述目标网站是否为违法违规网站。由此,可以实现在网站内嵌的情况下也能够有效地识别出违法违规网站,提升了违法违规网站识别的准确率。
-
公开(公告)号:CN112613324B
公开(公告)日:2024-11-12
申请号:CN202011596697.5
申请日:2020-12-29
申请人: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 国科智安(北京)科技有限公司
摘要: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN112613324A
公开(公告)日:2021-04-06
申请号:CN202011596697.5
申请日:2020-12-29
申请人: 北京中科闻歌科技股份有限公司 , 深圳中科闻歌科技有限公司 , 北京中科闻歌智安科技有限公司
摘要: 本申请涉及一种语义情绪识别方法、装置、设备及存储介质,所述方法包括:获取待识别文本,然后对待识别文本的全局语义信息进行提取,得到第一语义向量,再利用预训练的词向量模型确定待识别文本的词向量矩阵,之后根据词向量矩阵确定第二语义向量,根据词向量矩阵计算待识别文本中每个词的词向量与预设情绪词语的词向量的相似度,并将计算得到的所有相似度确定为第三语义向量,最后根据第一语义向量、第二语义向量和第三语义向量确定待识别文本所属的情绪类别,如此,便可以根据待识别文本的全局语义信息以及待识别文本的词向量矩阵确定待识别文本的情绪类别,考虑了待识别文本的词语义、词组语义以及句子语义信息,提高了情绪识别的准确性。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC分类号: G06F16/35 , G06F18/2411 , G06Q30/018
摘要: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN115952801A
公开(公告)日:2023-04-11
申请号:CN202211724914.3
申请日:2022-12-28
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F40/295 , G06F40/289 , G06F16/33
摘要: 本发明提供了一种企业名称对齐方法,包括:获取目标文本信息中的企业代称,以及与所述企业代称相关的关联地域实体和关联人物实体;获取所述企业代称中的构成要素,并基于获取的构成要素获取所述企业代称对应的企业简称集合,所述构成要素包括商号、地域、行业和机构类型中的至少一个;基于所述企业代称和对应的企业简称集合,获取与所述企业代称相关的候选企业信息列表,所述候选企业信息列表中包括n个候选企业信息,所述候选企业信息至少包括对应候选企业的企业名称;基于所述n个候选企业信息,获取与所述企业代称相关的目标企业名称。本发明还提供一种电子设备和存储介质。本发明能够提高企业名称对齐的准确率。
-
公开(公告)号:CN115271892A
公开(公告)日:2022-11-01
申请号:CN202210547647.0
申请日:2022-05-18
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06Q40/00 , G06F16/2458 , G06F16/2457 , G06N3/04 , G06N3/08 , G06Q50/26
摘要: 本公开实施例提供了一种骗取留抵退税识别模型的构建方法、装置、设备和存储介质。骗取留抵退税识别模型构建方法包括获取多个样本退税申请数据序列和对应的实体标签;基于样本退税申请数据序列确定对应的第一特征向量;基于多个第一特征向量和对应的实体标签对预先构建的骗取留抵退税识别模型进行训练。骗取留抵退税识别模型构建方法能够直接挖掘样本退税申请数据的特征构建骗取留抵退税识别模型,而无需如现有专家评价指标体系的方法需要依靠专家经验设定评价指标、指标权重和指标阈值的问题。
-
公开(公告)号:CN115952261A
公开(公告)日:2023-04-11
申请号:CN202211583589.3
申请日:2022-12-09
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/30 , G06N3/0455 , G06N3/08
摘要: 本发明提供了一种基于多任务学习的生成式阅读理解方法,所述方法包括如下步骤:获取目标问题和目标段落,获取目标问题和目标段落的对应的特征向量,将特征向量输入到目标阅读理解模型,获取目标答案;从而提高目标答案的准确性和可靠性。
-
公开(公告)号:CN113553839A
公开(公告)日:2021-10-26
申请号:CN202010340711.9
申请日:2020-04-26
申请人: 北京中科闻歌科技股份有限公司
IPC分类号: G06F40/279 , G06F40/194
摘要: 本申请涉及一种文本原创识别方法、装置、电子设备及存储介质,该方法包括:获取待识别的第一文本数据,以及与所述第一文本数据相关联的第二文本数据;确定所述第一文本数据的来源信息;当所述来源信息不满足于预设条件时,对所述第一文本数据和所述第二文本数据进行比较,得到相似度特征指标;将所述相似度特征指标输入训练好的识别模型,由所述识别模型根据所述相似度特征指标进行计算得到所述文本数据的原创识别结果。该技术方案一方面通过基于来源信息对文本进行初步原创判断,另一方面采用相似度指标对文本进行原创识别,以此种方式提高了原创识别的准确性和有效性,本申请采用的方法能够更好的服务于新闻工作的需求。
-
公开(公告)号:CN113450116A
公开(公告)日:2021-09-28
申请号:CN202010214388.0
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
摘要: 本申请涉及一种交易风险分析方法,包括:获取待分析数据,待分析数据包括:交易数据以及舆情数据;对交易数据进行定量分析得到第一数据特征,对舆情数据进行定量分析得到第二数据特征;对第一数据特征进行判别确定交易数据的第一风险类型,对第二数据特征进行判别确定舆情数据的第二风险类型,对第一风险类型以及第二风险类型分别进行向量化,得到第一特征向量和第二特征向量;将第一特征向量和第二特征向量输入预先训练的预警模型,由预警模型根据第一特征向量和第二特征向量进行计算得到风险指数;根据风险指数确定待分析数据的风险分析结果。本方案采用机器学习的方法对交易风险进行分级预警,从而大大提高交易风险预警的准确性和有效性。
-
-
-
-
-
-
-
-
-