-
公开(公告)号:CN108090222B
公开(公告)日:2020-07-07
申请号:CN201810011460.2
申请日:2018-01-05
Applicant: 中国科学院计算技术研究所 , 中科天玑数据科技股份有限公司
IPC: G06F16/27
Abstract: 本发明公开了一种数据库集群节点间数据同步系统,涉及数据处理领域。所述系统包括配置单元、元数据存储单元、元数据判断单元、读写判断单元、Paxos同步单元、日志存储单元和日志重现单元。本发明解决了现有数据库同步方法中异步方式可能导致数据库集群数据不一致的问题,也解决了同步方式可能因为某个节点阻塞导致性能低下的问题;最后,本发明所述数据库集群节点间数据同步系统也支持不同方向的数据同步,没有只能将数据从主数据库同步到从数据库的限制。
-
公开(公告)号:CN108090222A
公开(公告)日:2018-05-29
申请号:CN201810011460.2
申请日:2018-01-05
Applicant: 中国科学院计算技术研究所 , 中科天玑数据科技股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种数据库集群节点间数据同步系统,涉及数据处理领域。所述系统包括配置单元、元数据存储单元、元数据判断单元、读写判断单元、Paxos同步单元、日志存储单元和日志重现单元。本发明解决了现有数据库同步方法中异步方式可能导致数据库集群数据不一致的问题,也解决了同步方式可能因为某个节点阻塞导致性能低下的问题;最后,本发明所述数据库集群节点间数据同步系统也支持不同方向的数据同步,没有只能将数据从主数据库同步到从数据库的限制。
-
公开(公告)号:CN108600321A
公开(公告)日:2018-09-28
申请号:CN201810253247.2
申请日:2018-03-26
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及一种基于分布式内存云的图数据存储方法和系统,包括:图服务层,用于在分布式内存云中为每个服务器分配虚拟节点,根据虚拟节点的哈希值,将虚拟节点映射到哈希环,保存映射关系作为哈希映射表,获取每个服务器所存储的图数据,同过在哈希映射表上检索图数据的哈希值,将图数据存入对应的虚拟节点;当增加新服务器时,在分布式内存云中为新服务器分配新虚拟节点并更新哈希映射表,根据新虚拟节点的哈希值,将新虚拟节点加入哈希环中,并根据虚拟节点存储的图数据的哈希值和更新后的哈希映射表,对哈希环中每个虚拟节点进行数据迁移。通过一致性哈希算法使本发明支持动态扩容,也即能增加或删除节点,且节点发生故障时能尽量减少损失。
-
公开(公告)号:CN103824115B
公开(公告)日:2017-07-21
申请号:CN201410072412.6
申请日:2014-02-28
Applicant: 中国科学院计算技术研究所
IPC: G06N5/04
Abstract: 本发明提供一种面向开放网络知识库的实体间关系推断方法。该方法包括根据目标实体从知识库中找出所有与该目标实体之间有关系路径相连的所有实体作为候选实体集;根据待推断的目标关系从所述知识库中找出的所有存在所述目标关系的实体对;以及综合考虑所找出的各实体对间的关系路径信息以及各实体的属性信息来从所述候选实体集中选出可能与该目标实体存在所述目标关系的候选实体。该方法利用知识库中已有的实体关系和实体的属性自动对实体间的关系进行推理,有效改善了推断效果,实现了对知识库中关系的丰富与完善。
-
公开(公告)号:CN104077417A
公开(公告)日:2014-10-01
申请号:CN201410342939.6
申请日:2014-07-18
Applicant: 中国科学院计算技术研究所
CPC classification number: G06F17/30675 , G06F17/30702 , G06Q50/01
Abstract: 本发明提供一种社交网络中的人物标签推荐方法和系统,所述方法包括:基于被推荐用户的社交对象发布的文本内容,将社交对象划分为在语义空间上相似的多个类簇;其中,每个社交对象发布的文本内容由该社交对象发布的多个短文本消息组成。所述方法还包括:对于所述多个类簇中的每个类簇,将该类簇中的社交对象所对应的标签进行冗余处理,得到与该类簇对应的标签集合以提供给被推荐用户。本发明解决了现有人物标签推荐技术中,标签推荐质量不高的问题,以及能使标签推荐的结果更具个性化并且更加多样化。
-
公开(公告)号:CN101882148B
公开(公告)日:2012-01-04
申请号:CN201010189851.7
申请日:2010-05-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及自动识别网页中维吾尔文的方法和系统,方法包括:步骤1,确定作为识别特征的n元组中n的取值,使用的每种语言,统计语言的各个n元组在使用语言的训练网页中的出现频率,为一个权重值,并且取n元组在预设标准编码中的有效位生成权重值对应的特征ID;步骤2,统计待识别网页中每个n元组的出现次数,取n元组在预设标准编码中有效位生成出现次数对应的识别ID,对于训练网页使用的每种语言,将特征ID的权重值和与特征ID相同的识别ID的出现次数相乘,叠加乘积,所得和值为待识别网页对应于语言的分值,待识别网页使用的语言为最高分值对应的语言。本发明能够提高识别的准确性。
-
公开(公告)号:CN101231634B
公开(公告)日:2011-05-04
申请号:CN200710308516.2
申请日:2007-12-29
Applicant: 中国科学院计算技术研究所
Abstract: 本发明公开了一种利用图划分方法来自动提取多文档文摘的方法,包括以下步骤:进行句子边界切分,把文档用切分出来的句子表示;将句子表示成向量,计算句子两两间的相似度构成句子关联矩阵,并按指定的阈值对关联矩阵进行约简,同时进行规范化处理;在多文档文摘中引入主题的隐性逻辑结构的挖掘,将文档集按主题划分成不同的隐性子主题,从而把文摘任务转化为对子主题的选取和抽取过程;利用图划分的方法,既从全局特性上保证句子所在子主题的重要度,又从局部特性上保证不同子主题之间内容的低冗余性,从而有效提高了文摘质量。
-
公开(公告)号:CN101882148A
公开(公告)日:2010-11-10
申请号:CN201010189851.7
申请日:2010-05-24
Applicant: 中国科学院计算技术研究所
Abstract: 本发明涉及自动识别网页中维吾尔文的方法和系统,方法包括:步骤1,确定作为识别特征的n元组中n的取值,使用的每种语言,统计语言的各个n元组在使用语言的训练网页中的出现频率,为一个权重值,并且取n元组在预设标准编码中的有效位生成权重值对应的特征ID;步骤2,统计待识别网页中每个n元组的出现次数,取n元组在预设标准编码中有效位生成出现次数对应的识别ID,对于训练网页使用的每种语言,将特征ID的权重值和与特征ID相同的识别ID的出现次数相乘,叠加乘积,所得和值为待识别网页对应于语言的分值,待识别网页使用的语言为最高分值对应的语言。本发明能够提高识别的准确性。
-
公开(公告)号:CN104866558B
公开(公告)日:2018-08-10
申请号:CN201510252840.1
申请日:2015-05-18
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种社交网络账号映射模型训练方法,包括:1)将映射关系已知的微博s账号集合中的任一个账号与微博t账号集合中的任一个账号进行两两组合构成训练集;2)对每一个账号组合提取账号组合特征向量,包括:该账号组合中两个账号各自的文本特征,两个账号在各自所属微博中的社交关系特征,以及两个账号的扩展共同邻居特征,扩展共同邻居是两个账号各自的邻居账号中,那些已知属于同一个自然人的邻居账号对;3)基于机器学习技术进行训练得到社交网络账号映射模型。本发明还提供了相应的社交网络账号映射方法及系统。本发明能够减少关系数据稀疏性对映射结果的不利影响,有效地提高社交网络账号映射的准确率。
-
公开(公告)号:CN104933139B
公开(公告)日:2018-06-01
申请号:CN201510337334.2
申请日:2015-06-17
Applicant: 中国科学院计算技术研究所
Abstract: 本发明提供一种社交网络用户身份虚实映射的方法及装置,涉及网络数据挖掘技术,能够较准确地推测出社交网络中个体用户的真实身份。所述方法包括:获取身份待定用户的三度好友并生成相应的社交网络拓扑结构图,所述三度好友包括所述身份待定用户的好友、好友的好友以及好友的好友的好友;在所述社交网络拓扑结构图中查找完全子图;根据所述完全子图中各身份已知的好友的身份特征属性,确定所述身份待定用户的身份特征属性。
-
-
-
-
-
-
-
-
-