-
公开(公告)号:CN115345181A
公开(公告)日:2022-11-15
申请号:CN202210786892.7
申请日:2022-07-04
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/58 , G06F16/36 , G06F40/211 , G06F40/295 , G06N3/04 , G06N3/08
Abstract: 本发明提供一种神经机器翻译模型的训练方法、翻译方法及装置,所述训练方法包括:构建神经机器翻译模型;将双语平行句对中的源语言句子和目标语言句子,以及知识图谱中每个三元组中的头实体和尾实体进行细粒度切分,得到标准源语言句子序列、标准目标语言句子序列以及知识图谱中每个三元组中的标准头实体‑关系序列和标准尾实体序列;将其输入编解码模块中预测得到目标语言句子序列以及尾实体序列;基于标准目标语言句子序列和预测的目标语言句子序列之间的交叉熵,以及知识图谱中每个三元组中的标准尾实体序列与预测的尾实体序列之间的交叉熵,共同训练该模型。本发明能够有效融合细粒度知识推断,提升神经机器翻译对于实体的翻译质量。
-
公开(公告)号:CN115310000A
公开(公告)日:2022-11-08
申请号:CN202110432130.2
申请日:2021-04-21
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC: G06F16/9536 , G06F16/955 , G06Q50/00
Abstract: 本发明提供了一种信息处理方法、处理装置、电子设备和可读存储介质,方法包括:获取文本数据,根据文本数据得到目标统一资源定位符;将文本数据输入至目标业务的分类模型,得到文本数据的目标业务相关度;确定目标统一资源定位符的热度值;根据热度值和文本数据的目标业务相关度,确定目标统一资源定位符的推荐指数;根据推荐指数,输出目标统一资源定位符,通过运行该方法,可以为文本数据中的抽取得到的目标统一资源定位符标注推荐指数,并根据推荐指数输出目标统一资源定位符,以实现信源的推荐。
-
公开(公告)号:CN115270717A
公开(公告)日:2022-11-01
申请号:CN202210764767.6
申请日:2022-06-29
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F40/126 , G06F40/284 , G06F40/30 , G06F16/35
Abstract: 本公开涉及一种立场检测方法、装置、设备及介质,其中该方法包括:获取文本中包含的词汇的语义编码和特征信息,特征信息包括词性信息;根据文本中包含的词语的排列顺序以及词性,生成至少一个预设句式结构的短语;根据文本中包含的词汇的语义编码生成短语的语义编码序列;基于短语的第一语义编码序列和预设的观点的第二语义编码序列,对短语和观点进行聚类;根据聚类结果确定文本中包含的观点,实现了对文本所包含词汇的特征信息的综合分析,从而能够准确判断文本的立场观点。
-
公开(公告)号:CN114881161A
公开(公告)日:2022-08-09
申请号:CN202210546540.4
申请日:2022-05-20
Applicant: 国家计算机网络与信息安全管理中心
Abstract: 本发明公开了一种面向多社交网络平台的机器人检测方法,包括:获取社交网络平台的用户账号数据,将账号ID作为用户的唯一标识符,提取用户特征,朋友特征,网络特征,内容特征,情感特征,时序特征;构建高维的原始矩阵,通过显著性分析,得到低维的特征矩阵;采用聚类算法或分类算法实现划分,识别出正常用户账号与机器人账号。本发明还公开了一种面向多社交网络平台的机器人检测装置、电子设备及存储介质。本发明对境内外多个社交网络平台账号数据进行研究,通过特征表示、特征显著性分析、聚类或分类等算法进行社交机器人检测,识别出社交网络中的社交机器人账号,从而预警大规模社交机器人异常行为,进而维护社交网络安全。
-
公开(公告)号:CN113312478B
公开(公告)日:2022-07-19
申请号:CN202110445975.5
申请日:2021-04-25
Applicant: 国家计算机网络与信息安全管理中心 , 北京航空航天大学
IPC: G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06F40/216 , G06N5/02
Abstract: 本发明公开了基于阅读理解的观点挖掘方法,包括:构建领域情感观点知识库,其内包含领域情感观点词,每个领域情感观点词对应一个情感分类标签和一个立场分类标签;基于所述领域情感观点知识库和事件观点训练文本集,对预训练语言模型进行训练,获得情感预训练语言模型,所述情感预训练语言模型中嵌入有表示输入文本的情感和观点信息;从待抽取事件文本中抽取事件观点文本;将所述事件观点文本输入所述情感预训练语言模型中,并对其输出的内容进行编码、句子特征提取和分类,获得待抽取事件文本中观点的情感和立场;以及,基于阅读理解的观点挖掘装置。本发明具有使观点挖掘结果更加准确的优点。
-
公开(公告)号:CN108920479B
公开(公告)日:2022-06-17
申请号:CN201810337919.8
申请日:2018-04-16
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/958 , G06Q10/06 , G06Q50/00
Abstract: 本发明公开了一种针对两微一端跨信源账号推荐方法,包括:将两微一端跨信源账号关联度衡量指标分为三级,包括多个一级关联度衡量指标,各个一级指标下分多个二级指标,以及各二级指标对应的各维度数据字段为三级指标;确定种子账号和多个目标账号;采集三级指标下的各维度数据,量化各个维度数据的相似度;基于用户关注度需求确定一级指标权重和一级指标下各个二级指标的权重;将所得各类三级关联度衡量指标下各个维度数据相似度与各自权重加权求和,获得各目标账号关联度指数,并将这些目标账号关联度指数倒序推荐。本发明所述推荐方法可跨信源进行账号推荐,且推荐结果精确合理。
-
公开(公告)号:CN108763319B
公开(公告)日:2022-02-08
申请号:CN201810396753.7
申请日:2018-04-28
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/335 , G06N3/04 , G06Q50/00
Abstract: 本发明属于计算机技术领域,具体提供了一种融合用户行为和文本信息的社交机器人检测方法和系统。旨在解决现有技术手动选取特征、忽略社交媒体帖子之间的逻辑性和时序性以及忽略社交平台用户行为信息的问题,本发明的社交机器人的检测方法包括获取待检测社交媒体用户的历史网络数据和好友网络数据;基于上述数据得到用户文本特征向量、行为特征向量以及好友网络特征向量,并将其融合,得到待检测社交媒体用户的用户特征向量;对用户特征向量进行检测,输出检测结果。本发明的方法更加符合社交媒体自身的特性,从多个维度分析待检测社交媒体用户,提升了检测准确率。本发明的系统同样具有上述有益效果。
-
公开(公告)号:CN113268673A
公开(公告)日:2021-08-17
申请号:CN202110443364.7
申请日:2021-04-23
Applicant: 国家计算机网络与信息安全管理中心 , 北京蓝光汇智网络科技有限公司
IPC: G06F16/9536 , G06F40/253 , G06F40/284
Abstract: 本发明公开了一种互联网行动类信息线索分析的方法,包括:从互联网获取信息文本;将信息文本输入预训练的行动线索标注算法模型中,应用预训练的行动线索标注算法模型获取信息文本中的行动类信息线索单词;其中,所述行动类信息线索单词的实体类型包括自定义类型,所述行动线索标注算法模型对属于自定义类型的单词的权重进行增量运算。本发明可以对采集内容进行快速的语法分析,获取内容中用户关注的时间、地点、人物和活动等行动类线索信息,这样就可以对关键词信息进行标注或分类,最终让用户可以很清晰、明了的查看线索信息内容。
-
公开(公告)号:CN107066554B
公开(公告)日:2020-12-15
申请号:CN201710183767.6
申请日:2017-03-24
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/30
Abstract: 本发明公开了一种微博相关人物推荐方法,包括:步骤一、微博用户识别:解析当前用户所有博文中的多个关键字以及每个关键字的权重Wki;获取至少一篇相匹配博文,相匹配的博文具有所述多个关键字,获取各相匹配博文的微博主,再获取各微博主对多个关键字中各关键字的权重UWki;步骤二、相关用户过滤:从所获取的微博主中筛选掉已经被当前用户关注的微博主,从而获得至少一个相关用户;步骤三、用户相关性权重计算:依据相关性权重公式计算每个相关用户的相关性权重;步骤四、根据所述至少一个相关用户的相关性权重,将相关性权重排名在排序规定值之前的相关用户推荐给当前用户。本发明可以使用户更加方便直接地关注自己感兴趣的内容和微博人物。
-
公开(公告)号:CN106980692B
公开(公告)日:2020-12-08
申请号:CN201710213302.0
申请日:2017-04-01
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/35 , G06F16/9536 , G06Q50/00
Abstract: 本发明涉及一种基于微博特定事件的影响力计算方法,属于社交网络分析及数据挖掘技术领域。本发明依据传播学中事件发展的五个阶段对特定事件进行了相关分析划分并应用于影响力计算中,主要针对微博文本数据及基础的用户数据进行统计处理与自然语言处理,计算传播角度和内容角度兼顾的六项影响力指标,并使用K‑means机器学习算法对子话题进行划分;最终得出特定事件的影响力热度指数EII、事件内的用户影响力排行榜、消息影响力排行榜。对比现有技术,本发明考虑微博文本的内容指标,较全面而准确地反映了事件各方面的信息,具有很强的现实意义和实用价值。此外,本发明方法计算的时空耗费不高,易于模块化,可投入大规模的数据计算,具有较好的稳定性。
-
-
-
-
-
-
-
-
-