-
公开(公告)号:CN116127964A
公开(公告)日:2023-05-16
申请号:CN202211600947.7
申请日:2022-12-13
IPC分类号: G06F40/284 , G06F40/30 , G06F16/35 , H04L9/40 , H04W12/12
摘要: 本发明公开了一种融合传播关系的诈骗信息的检测方法。该方法包括:获取第一信息组、诈骗账号库以及正常账号库,其中第一信息组中的每一个信息包括文本信息和发信账号;根据诈骗账号库和正常账号库从第一信息组中确定第二信息组,其中第二信息组中的每一个信息的发信账号在诈骗账号库和正常账号库中都不存在;根据第二信息组得到多个目标信息组,其中每一个目标信息组中的第一发信账号与第二发信账号的相似文本信息的数量大于第一阈值;计算每一个目标信息组的诈骗权重值;在目标信息组的诈骗权重值大于第二阈值的情况下,将目标信息组中的每一个文本信息确定为诈骗信息。本发明解决了对大量诈骗信息进行检测时,处理效率低的技术问题。
-
公开(公告)号:CN115718835A
公开(公告)日:2023-02-28
申请号:CN202211370652.5
申请日:2022-11-03
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC分类号: G06F16/9535 , G06F17/16
摘要: 本申请涉及一种破除信息茧房问题的冷启动个性化推荐方法及装置,其中,方法包括:在目标账号的使用阶段处于冷启动阶段的情况下,确定与目标账号的用户行为相似度达到第一阈值的对照账号;利用对照账号的对照兴趣矩阵确定目标账号的目标兴趣矩阵;利用目标兴趣矩阵在预设内容池中确定候选推荐集;利用量化因子对候选推荐集中的特征相关度进行权重调整,得到各个候选推荐数据的推荐指数;将推荐指数达到第二阈值的候选推荐数据确定为目标推荐数据,并将目标推荐数据推送给目标账号。通过对照账号来预测用户账号的兴趣矩阵,然后用兴趣矩阵选出候选推荐集,最后结合目标账号的浏览记录确定推荐数据,解决了为冷启动阶段用户推荐的内容趋于同质化的问题。
-
公开(公告)号:CN115270807A
公开(公告)日:2022-11-01
申请号:CN202210764771.2
申请日:2022-06-29
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
摘要: 本公开涉及一种网络用户的情感倾向判定方法、装置、设备及存储介质,其中方法包括:获取网络用户对目标事件评论的第一评论信息,以及对象对所述目标事件的第二评论信息;根据所述第一评论信息构建所述目标事件的知识图谱;基于所述知识图谱对所述第二评论信息进行情感分析,得到第一情感倾向值;至少基于所述第一情感倾向值,确定所述对象对于所述目标事件的情感倾向。本公开使用整体网络用户的评论构建知识图谱作为目标事件的背景知识库,通过结合目标事件的背景知识来对目标对象的网络用户的评论进行情感分析,进而判定情感倾向,使得对网络用户情感倾向的判定更准确。
-
公开(公告)号:CN113505221B
公开(公告)日:2024-03-12
申请号:CN202010214386.1
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC分类号: G06F16/35 , G06F18/2411 , G06Q30/018
摘要: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN113450116A
公开(公告)日:2021-09-28
申请号:CN202010214388.0
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
摘要: 本申请涉及一种交易风险分析方法,包括:获取待分析数据,待分析数据包括:交易数据以及舆情数据;对交易数据进行定量分析得到第一数据特征,对舆情数据进行定量分析得到第二数据特征;对第一数据特征进行判别确定交易数据的第一风险类型,对第二数据特征进行判别确定舆情数据的第二风险类型,对第一风险类型以及第二风险类型分别进行向量化,得到第一特征向量和第二特征向量;将第一特征向量和第二特征向量输入预先训练的预警模型,由预警模型根据第一特征向量和第二特征向量进行计算得到风险指数;根据风险指数确定待分析数据的风险分析结果。本方案采用机器学习的方法对交易风险进行分级预警,从而大大提高交易风险预警的准确性和有效性。
-
公开(公告)号:CN115310000A
公开(公告)日:2022-11-08
申请号:CN202110432130.2
申请日:2021-04-21
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 国科智安(北京)科技有限公司
IPC分类号: G06F16/9536 , G06F16/955 , G06Q50/00
摘要: 本发明提供了一种信息处理方法、处理装置、电子设备和可读存储介质,方法包括:获取文本数据,根据文本数据得到目标统一资源定位符;将文本数据输入至目标业务的分类模型,得到文本数据的目标业务相关度;确定目标统一资源定位符的热度值;根据热度值和文本数据的目标业务相关度,确定目标统一资源定位符的推荐指数;根据推荐指数,输出目标统一资源定位符,通过运行该方法,可以为文本数据中的抽取得到的目标统一资源定位符标注推荐指数,并根据推荐指数输出目标统一资源定位符,以实现信源的推荐。
-
公开(公告)号:CN115270717A
公开(公告)日:2022-11-01
申请号:CN202210764767.6
申请日:2022-06-29
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC分类号: G06F40/126 , G06F40/284 , G06F40/30 , G06F16/35
摘要: 本公开涉及一种立场检测方法、装置、设备及介质,其中该方法包括:获取文本中包含的词汇的语义编码和特征信息,特征信息包括词性信息;根据文本中包含的词语的排列顺序以及词性,生成至少一个预设句式结构的短语;根据文本中包含的词汇的语义编码生成短语的语义编码序列;基于短语的第一语义编码序列和预设的观点的第二语义编码序列,对短语和观点进行聚类;根据聚类结果确定文本中包含的观点,实现了对文本所包含词汇的特征信息的综合分析,从而能够准确判断文本的立场观点。
-
公开(公告)号:CN113505221A
公开(公告)日:2021-10-15
申请号:CN202010214386.1
申请日:2020-03-24
申请人: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司 , 北京中科闻歌智安科技有限公司
摘要: 本发明公开了一种企业虚假宣传风险识别方法、设备和存储介质。该方法包括:在目标企业对应的多个企业舆情文本中,提取疑似风险文本;在每个疑似风险文本中提取对应种类的风险特征,形成每个疑似风险文本对应的风险特征向量;将多个疑似风险文本分别对应的风险特征向量顺次输入预先训练的风险识别模型,使风险识别模型对每个疑似风险文本进行识别,并将识别为存在虚假宣传风险的疑似风险文本确定为风险文本;根据确定出的所有风险文本的信息,确定目标企业对应的虚假宣传风险强度值;如果虚假宣传风险强度值大于预设的风险阈值,则确定目标企业存在虚假宣传风险。本发明可以避免人工匹配规则的局限性,提升了虚假宣传风险识别的准确性。
-
公开(公告)号:CN114912434A
公开(公告)日:2022-08-16
申请号:CN202210495306.3
申请日:2022-05-07
申请人: 国家计算机网络与信息安全管理中心 , 中国科学院自动化研究所
IPC分类号: G06F40/211 , G06F40/253 , G06F40/268 , G06N3/04 , G06N3/08 , G06N5/02 , G06K9/62
摘要: 本发明公开了一种风格文本的生成方法及装置、存储介质、电子设备,其中,该方法包括:根据特征词和观点词构建句法模板;根据所述句法模板提取文本特征标签组合;确定目标风格文本的目标写作风格,将所述目标写作风格的风格参数作为生成条件嵌入Bert生成模型中,生成目标Bert语言表征模型;以所述文本特征标签组合为所述目标Bert语言表征模型的输入,生成与所述目标写作风格对应的条件文本。通过本发明,解决了相关技术采用网络模型生成的文本风格单一的技术问题,本方案可用于在信息传播过程中生成更多优质内容和个性化内容,提高文本的丰富度,提升传播影响力。
-
公开(公告)号:CN109977227B
公开(公告)日:2021-06-22
申请号:CN201910205999.6
申请日:2019-03-19
申请人: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC分类号: G06F16/35 , G06F40/289 , G06F40/12 , G06N3/00 , G06N3/12
摘要: 本发明属于信息分类领域,具体涉及了一种基于特征编码的文本特征提取方法、系统、装置,旨在解决文本特征提取中运算复杂度高、分类效率和精度低的问题。本发明方法包括:对获取的文本预处理,获得词候选特征序列;基于词候选特征序列,生成多个二进制编码;采用基因遗传算法筛选二进制编码,获得最优二进制编码;解码最优二进制编码获得最优词特征序列并输出。本发明将一系列候选特征转化为易处理的编码序列,并使用基因遗传算法的自动筛选功能,对特征进行最大化的全局最优挑选,能够有效地筛选出最小有效特征集。
-
-
-
-
-
-
-
-
-