-
公开(公告)号:CN114880496B
公开(公告)日:2024-12-24
申请号:CN202210471183.X
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/432 , G06F16/435 , G06F16/483 , G06F40/279 , G06F40/30 , G06V40/16 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/82 , G06N3/0442 , G06N3/08 , G06N7/01 , G10L15/22
Abstract: 本公开涉及一种多媒体信息话题分析方法、装置、设备及计算机可读存储介质,本公开通过音频数据得到语音识别文本、通过视频数据的关键帧得到字幕文本;针对上述语音识别文本及字幕文本从实体、关键词、语义标签三方面提取话题信息,实现了基于文本数据的全方面、多粒度的文本话题提取;针对视频数据的关键帧,从人脸标签及图片标签两方面提取话题信息,实现了基于图像数据的视觉话题提取;本公开实施例充分考虑了视频数据的多模态特征,全面的分析视频话题,提高了话题分析的准确性;进一步的,通过准确的话题分析,可以使受众快速有效的获取视频的主要信息,提升了工作效率,并可以广泛应用于视频个性化推荐、视频内容检索等场景。
-
公开(公告)号:CN111859980B
公开(公告)日:2024-04-09
申请号:CN202010549951.X
申请日:2020-06-16
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/30 , G06F40/289 , G06F16/9536 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本申请涉及一种讽刺类型的文本识别方法、装置、设备及计算机可读介质。该方法包括:获取待处理文本,待处理文本来自于社交媒体网络平台;采用多种方式提取待处理文本的目标特征信息,目标特征信息为从特征集合中选择出来的多个特征信息的加权和表示;根据第一神经网络模型对目标特征信息的识别结果确定待处理文本的文本类型,第一神经网络模型是采用具有标记信息的训练数据对第二神经网络模型进行训练后得到的,标记信息用于标记训练数据是否为目标类型。本申请从多个维度捕获词间关联特征,并从讽刺文本的情感倾向转换出发,挖掘词语间的冲突性,进而充分体现句子中地所蕴含的讽刺含义,最终准确、合理地识别讽刺文本。
-
公开(公告)号:CN116882401A
公开(公告)日:2023-10-13
申请号:CN202310510969.2
申请日:2023-05-08
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/295 , G06F40/216 , G06F16/35 , G06F16/9535 , G06V20/62 , G06V30/148 , G06V30/19
Abstract: 本发明提供了一种基于新闻客户端的突发事件预警信息分析系统,包括:数据处理模块,其对原始文章数据进行格式化预处理;自定义标签模块,其用于获取突发预警标签;文本分析模块,其对格式化文本数据进行分析,提取出时间、地点、人物、机构和自定义的预警信息;图片分析模块,其对格式化图片数据进行分析,对特征目标区域的字符进行分割和分类;评论情绪分析模块,其用于对格式化评论数据进行分析,获得原始文章数据的情绪类型。本发明还提供了一种基于新闻客户端的突发事件预警信息分析方法。本发明能够快速分析新闻文章信息中时间、地点、人物、机构和主题信息,以及能够从文本正文、正文中图片和评论正负面情绪三个维度进行全方位识别分析。
-
公开(公告)号:CN111737590B
公开(公告)日:2023-09-12
申请号:CN202010442783.4
申请日:2020-05-22
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9536 , G06F16/33
Abstract: 本发明公开了社交关系挖掘方法、装置、电子设备以及存储介质。所述方法包括:获取群组的对话流数据;将所述对话流数据划分为多个对话队列,其中,各对话队列的时间跨度小于或等于时间阈值;根据各对话队列中对话信息的上下文相关度,确定构成真实对话场景的对话队列;提取所述构成真实对话场景的对话队列所对应的用户,作为具有社交关系的用户。基于该方法及装置,可以还原对话场景,进而更加精准地映射对话用户,挖掘用户社交关系。
-
公开(公告)号:CN116681066A
公开(公告)日:2023-09-01
申请号:CN202310499505.6
申请日:2023-05-06
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F40/289 , G06F40/30 , G06F18/214 , G06F18/241
Abstract: 本发明公开了基于ERNIE模型的态度检测方法,其特征在于,包括:获取待测某信息下的原创文本及其评论、转发关系,得所述待测某信息下的原创文本及其对应的评论文本和转发文本;基于ERNIE模型,对所述原创文本、评论文本和转发文本的态度进行检测,得文本态度检测结果;获取所述原创文本、评论文本和转发文本对应的用户ID和发布时间,根据所述文本态度检测结果,采用时间衰减函数和最大概率和的规则,对待测用户的态度进行检测,得用户态度检测结果;以及,基于ERNIE模型的态度检测装置。本发明具有对态度的识别的精度高、泛化能力强等优点。
-
公开(公告)号:CN114817636A
公开(公告)日:2022-07-29
申请号:CN202210469600.7
申请日:2022-04-28
Applicant: 国家计算机网络与信息安全管理中心 , 北京中科闻歌科技股份有限公司
IPC: G06F16/783 , G06V20/40 , G06V20/62 , G06V10/774 , G06V10/764 , G06V10/80 , G06V10/82 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种视频检测方法、装置、设备及计算机可读存储介质,该方法包括:获取待检测视频的多种特征信息;基于所述多种特征信息,生成所述待检测视频的融合特征信息;基于所述待检测视频的融合特征信息,对所述待检测视频的安全性进行检测,得到检测结果。本公开通过充分利用视频数据中的多种模态维度的特征信息得到视频的融合特征信息,根据融合特征信息对待检测视频内容进行检测,能够发现各模态维度信息之间关联而形成的隐性安全问题,大大提高了视频检测方法的准确性。
-
公开(公告)号:CN114330321A
公开(公告)日:2022-04-12
申请号:CN202111666897.8
申请日:2021-12-31
Applicant: 中国科学院自动化研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F40/279 , G06K9/62 , G06N3/04 , G06N3/08 , G06N5/02
Abstract: 本发明公开了一种用户先验知识增强的文本风格迁移方法、装置及电子设备,所述方法包括:获取用户先验知识数据,并基于所述用户先验知识数据构建预设神经网络模型;获取用户输入数据,并将所述用户输入数据映射至所述预设神经网络模型中,生成与所述用户输入数据的表达方式不同的目标文本内容表示;获取用户关注领域表示,并结合所述目标文本内容表示和用户关注领域表示,生成目标文本内容。本发明不仅可以实现文本风格的转换,还提升了转换文本内容与用户要求的相关性。
-
公开(公告)号:CN114297498A
公开(公告)日:2022-04-08
申请号:CN202111638795.5
申请日:2021-12-29
Applicant: 国家计算机网络与信息安全管理中心
IPC: G06F16/9535 , G06F16/9536 , G06N3/04 , G06Q50/00
Abstract: 本发明通过网络技术处理领域的方法,实现了一种基于关键传播结构感知的意见领袖识别方法和装置。方法基于神经网络算法,设计用户双重特征提取模块和关键传播结构挖掘模块两个逻辑模块组成,通过输入微博中不同话题数据,得到输入数据中具有代表性特征的意见领袖及关联关系输出。本发明设计基于节点中心度的消息传递机制,充分结合了节点在拓扑结构中的重要性,构造了一个新的图神经网络模型提取社交网络中用户的特征。首次利用图分类任务挖掘不同事件中的关键结构信息,在挖掘社交网络中top‑k个意见领袖的同时能够从节点连通性、节点相似度、节点中心度三个角度学习意见领袖之间潜在的联系,构造网络中的关键传播结构。
-
公开(公告)号:CN109241483B
公开(公告)日:2021-10-12
申请号:CN201811008674.0
申请日:2018-08-31
Applicant: 中国科学院计算技术研究所 , 国家计算机网络与信息安全管理中心
IPC: G06F16/958
Abstract: 本发明涉及一种基于域名推荐的网站发现方法,包括:在域名字符集随机选取任意字符排列组合以获得词根字符串;以该词根字符串组成候选字符串;将该候选字符串与候选域名后缀进行拼接,组成推荐域名;对该推荐域名进行DNS解析,以判断为合法的该推荐域名为合法域名;验证该合法域名是否存在对应网站,若存在则获取为目标网站。
-
公开(公告)号:CN113449601A
公开(公告)日:2021-09-28
申请号:CN202110591209.X
申请日:2021-05-28
Applicant: 国家计算机网络与信息安全管理中心 , 中国科学院计算技术研究所
Abstract: 本发明提出一种基于渐进性平滑损失的行人重识别模型训练方法,包括:获取训练样本数据;其中,所述训练样本数据包括多个包含行人的视频;将所述训练样本数据输入至初始模型中,得到对应各所述包含行人的视频的帧级别特征和视频级别特征;分别基于所述帧级别特征和所述视频级别特征计算第一损失和第二损失;基于所述第一损失和所述第二损失对所述初始模型的模型参数进行优化,得到行人重识别模型。
-
-
-
-
-
-
-
-
-