-
公开(公告)号:CN108492200A
公开(公告)日:2018-09-04
申请号:CN201810124041.X
申请日:2018-02-07
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于卷积神经网络的用户属性推断方法和装置。该方法根据用户节点的属性和好友关系,建立自中心网络;然后采用卷积神经网络提取所述自中心网络中用户节点的属性信息和好友关系中所包含的隐藏信息,利用所述隐藏信息推断出用户的缺失属性。针对好友关系无法直接获取或获取难度较大的社交网络,采用神经网络仅利用用户的属性信息对缺失的属性进行分类预测。本发明可以很好的避免人为定义相似度函数的局限性,而且通过卷积核的卷积操作能够更好的表现出不同属性间以及不同的属性维度间的关系,从而能够高效、准确地进行用户缺失属性推断。
-
公开(公告)号:CN107038026A
公开(公告)日:2017-08-11
申请号:CN201710112499.9
申请日:2017-02-28
Applicant: 中国科学院信息工程研究所
IPC: G06F9/44
CPC classification number: G06F8/658
Abstract: 本发明涉及一种增量式的自动机更新方法与系统。该方法包括:1)配置处理机进行初始化操作,根据配置文件生成初始自动机,并将初始自动机发送到各扫描机;2)配置处理机根据新配置文件生成更新后的自动机,并对更新后的自动机和更新前的自动机进行数据差分,生成自动机增量;3)配置处理机将自动机增量发到各扫描机,各扫描机根据自动机增量和更新前的自动机生成更新后的自动机。本发明一方面可以尽量减少因为初始化自动机而漏掉的需要过滤的数据,同时还能应用一些初始化时间较长的新的效果比较好的串匹配算法;另一方面可以避免因为发送完整自动机而导致的网络拥塞问题。
-
公开(公告)号:CN107016053A
公开(公告)日:2017-08-04
申请号:CN201710121255.7
申请日:2017-03-02
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提供一种并行的数据差分方法,步骤包括:(1)文件预处理:将源文件和目标文件初始化,生成源文件的后缀数组,创建补丁文件并初始化;(2)目标文件切分:根据线程数目切分目标文件,为切分后的每一部分目标文件增加一个线程进行独立处理;(3)线程处理过程:在每一线程中,初始化切分后的目标文件,创建patch文件,通过上述后缀数组比较源文件与目标文件生成差分数据,将该差分数据写入该patch文件;(4)主进程合并处理:将上述各线程的已写入差分数据的patch文件一起写入上述补丁文件。本方法采用多线程并行技术,来提高生成补丁的速度。
-
公开(公告)号:CN106326475A
公开(公告)日:2017-01-11
申请号:CN201610793354.5
申请日:2016-08-31
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种高效的静态哈希表实现方法及系统。该方法包括以下步骤:1)设定哈希桶大小hash_bit,生成多个数据对,将key[i]和value[i]对应于关键字和值;2)根据key[i]值,利用rank操作构建哈希表,并计算C表和D表;3)根据C表和D表计算rank(h),并根据rank(h)的值存储相应的key[i]和value[i];4)根据所要查询的值key判断哈希表中是否存在该元素,若存在则在对应存储位置查询并返回value值,否则访问失败;5)根据步骤4)所得的结果返回结果信息。本发明利用Rank-select算法实现新型静态哈希表的构建与访问,可用于内容过滤、信息安全等领域。
-
公开(公告)号:CN104809161A
公开(公告)日:2015-07-29
申请号:CN201510152316.7
申请日:2015-04-01
Applicant: 中国科学院信息工程研究所
IPC: G06F17/30
Abstract: 本发明涉及一种对稀疏矩阵进行压缩和查询的方法及系统。该方法对k2-tree方法进行了改进:一是rank操作的改变,二是对于一般矩阵和非零一矩阵的处理。首先对待处理的稀疏矩阵进行预处理,得到单元值为0或1且为方阵的稀疏矩阵A;然后采用k2-tree算法得到数组T(tree)和L(leaves),根据T(tree)中的信息对Rank数组间隔固定位数进行存储,得出Rank(tree),并根据L(leaves)和对应的原稀疏矩阵得到V(leaves)和rank(leaves)值,输入查询单元的坐标后,可查询得出稀疏矩阵A中存储的数值。本发明可以有效地压缩稀疏矩阵,使查询速度更快,存储空间更节省。
-
公开(公告)号:CN118631477A
公开(公告)日:2024-09-10
申请号:CN202310221375.X
申请日:2023-03-09
Applicant: 中国科学院信息工程研究所
IPC: H04L9/40 , H04L61/4511 , G06F18/241 , G06F18/214 , G06N3/04 , G06N3/0985 , G06F16/901
Abstract: 本发明涉及一种基于元学习的小样本恶意域名检测方法及装置。所述方法包括:将DNS场景建模为异质图;所述异质图的节点包括:客户端、域名和IP地址,所述异质图的边包括:客户端查询域名、域名解析为IP地址和域名的规范名称;基于异质图神经网络HGT来学习域名的节点表示,以得到更新后的域名特征向量;使用基于元学习的小样本分类器对所述更新后的域名特征向量进行分类,以得到恶意域名检测结果。本发明可以获取更好的恶意域名检测效果。
-
公开(公告)号:CN118332375A
公开(公告)日:2024-07-12
申请号:CN202410400399.6
申请日:2024-04-03
Applicant: 中国科学院信息工程研究所
IPC: G06F18/24 , G06F18/22 , G06F18/21 , G06N3/0985 , G06N3/0895 , G06N3/042 , G06N3/048 , G06N3/0464
Abstract: 本发明属于计算机数据挖掘分析技术领域,具体涉及一种基于任务级别关系建模的小样本图节点分类方法和装置。本发明利用对比学习方法来捕获元学习任务间的关系,通过拉近元学习任务图和原始图之间的距离捕获元任务间的相关性,通过拉远不同元学习任务图之间的距离捕获元任务间的差异性,整个方案遵循图元学习范式,对比学习作为子模块加入到图元学习框架中,最终通过联合优化完成小样本图节点分类任务。本发明设计了新的图元学习和图对比学习联合框架,利用对比学习建模了元学习任务间的复杂关系,在不引入额外标注信息的情况下,有效提升了小样本图节点分类任务的性能。
-
公开(公告)号:CN117909468A
公开(公告)日:2024-04-19
申请号:CN202410024770.3
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/35 , G06N20/00
Abstract: 本发明提出一种基于扩散模型的多粒度可控共情对话生成方法,属于文本生成领域。本发明首先通过提取标准回复的话语级别、句子级别和词语级别的控制因素,然后设计掩码矩阵进行细粒度控制,训练扩散模型;最后在共情对话生成阶段,从训练集中进行语义相似性和情绪一致性的匹配检索,将检索到的回复作为原型回复并提取控制因素,然后连同对话上下文输入到训练好的扩散模型中,获得最终的共情对话生成文本。本发明能够实现精细控制,生成的回复可以受到情绪不同程度影响,生成更加自然和适应上下文的共情回复,提高回复的多样性和复杂性。
-
公开(公告)号:CN117909438A
公开(公告)日:2024-04-19
申请号:CN202410024769.0
申请日:2024-01-08
Applicant: 中国科学院信息工程研究所
IPC: G06F16/31 , G06F16/33 , G06F40/30 , G06N3/0455
Abstract: 本发明公开了一种文档的篇章级事件论元抽取方法、系统及介质,属于文本信息抽取领域,针对上下文一致性检索、模式一致性检索和自适应混合检索这三种检索方式,通过构建基于T5模型的检索增强生成模型,执行对应的检索增强策略,可以回忆起有助于演示模型应该如何解决任务的样例。其中,本发通过自适应混合检索增强范式来生成参考向量作为深度线索,能够提高模型的类比能力。
-
公开(公告)号:CN111753150B
公开(公告)日:2023-10-13
申请号:CN202010412344.9
申请日:2020-05-15
Applicant: 中国科学院信息工程研究所
IPC: G06F16/9032
Abstract: 本发明公开一种基于图搜索方法加速epsilon闭包计算的方法及系统,涉及计算机领域,针对传统闭包计算整体消耗时间长的缺陷,为了优化闭包算法,利用图搜索的方法,在NFA构造DFA的过程中对现有的方法进行优化,加速了DFA的构造过程。
-
-
-
-
-
-
-
-
-