-
公开(公告)号:CN107194677A
公开(公告)日:2017-09-22
申请号:CN201710392057.4
申请日:2017-05-27
Applicant: 国家计算机网络与信息安全管理中心 , 北京赛思信安技术股份有限公司
Abstract: 本发明公开了一种比特币区域流向的统计方法,首先统计所有的交易所、矿池、赌博及比特币交易服务等主要的交易场所,并统计这些场所所属的国家及地区,然后搜集这些交易所的所有的钱包地址。然后根据区块链,查找某区块链中的所有的交易hash,根据该hash找到对应的具体交易信息,该信息中会包含交易双方的交易地址,根据交易地址所属的国家区域,可以分析出该交易属于哪个国家及地区的交易。本发明为监测比特币的区域流向提供一种可行的方案;本发明方法具有很广泛的应用前景。
-
公开(公告)号:CN106528536A
公开(公告)日:2017-03-22
申请号:CN201611001691.2
申请日:2016-11-14
Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
CPC classification number: G06F17/2765 , G06F17/2705
Abstract: 本发明公开一种基于词典与文法分析的多语种分词方法,可以实现中、日、韩、粤语等混合文本高效准确的分词处理,并且对于不同时段、不同专业的词可以实现灵活的词库扩展,有效更新词库信息,实现准确、高效的多语种语言文本分词;通过内嵌中日韩粤等语系子分词器、中文量子分词器和西方语系分词器,可以实现每类语种文本判断的准确分词;通过内置的语言片段编码识别机制字段对待分词文本片段进行切分,切分后的每种文本片段对应于一种语系,并使用相应的子分词器进行分词;通过文法分析可以实现西方屈折语的分词、中、日、韩、粤语的smart模式分词,可以处理含有阿拉伯数字信息的文本;同时,本发明还可以实现多种语言混合的文本分词,脱离了分词工具只能对单一语种、个别几个语种分词的局限性,保证文本分词的安全性、准确性、高效性、灵活性、普适性。通过本发明的提
-
公开(公告)号:CN106528535A
公开(公告)日:2017-03-22
申请号:CN201611001398.6
申请日:2016-11-14
Applicant: 北京赛思信安技术股份有限公司 , 国家计算机网络与信息安全管理中心
IPC: G06F17/27
CPC classification number: G06F17/275
Abstract: 本发明提供了一种基于编码和机器学习的多语种识别方法,是计算机对自然语言的处理技术。本方法分别通过机器学习单元和编码识别单元对文本进行语种识别,编码识别时还统计各语种的单词量,当机器学习单元的识别结果在编码识别单元的判定区间内,且二者识别的语言一致时,输出单一识别语言,当编码识别单元识别到多种语言时,进行混合语言规则判断,若第二语言在文本中的单词量比例达到设定比例,则判定文本为混合语言。本发明对长文本可先作随机采样再判定,以提高识别效率。本发明能够准确、高效地实现中文简繁体、日、法、英等99种语言的语种识别,同时支持混合语种文本识别,在海量数据分析以及舆情监控中具有广泛的应用前景。
-
公开(公告)号:CN106101018A
公开(公告)日:2016-11-09
申请号:CN201610397801.5
申请日:2016-06-07
Applicant: 北京赛思信安技术股份有限公司
IPC: H04L12/861 , H04L29/08
CPC classification number: H04L49/9047 , H04L67/1097 , H04L67/141 , H04L67/2842
Abstract: 本发明公开了一种面向分布式海量数据加载系统的可靠数据发送方法,消息结构包括消息头和消息体两部分构成;消息头包括:消息ID,消息类型和自定义消息。该消息可以通过http,https,TCP/IP或者其他类型的网络传输协议进行网络传输。接收终端可以根据消息头部的消息ID进行去重,验证等操作并且返回处理结果。按照本发明提供的方法,用户可以准确,有效的向分布式系统中发送数据。
-
公开(公告)号:CN105472024A
公开(公告)日:2016-04-06
申请号:CN201511001080.3
申请日:2015-12-28
Applicant: 北京赛思信安技术股份有限公司
IPC: H04L29/08
CPC classification number: H04L67/1095 , H04L67/02 , H04L67/26
Abstract: 本发明提供了一种基于消息推送模式的跨地域数据同步方法,用于实现对不同数据中心的数据进行异地备份和恢复,属于海量数据管理领域。本方法在各数据中心配置集群内各数据中心消息组件部署的IP地址,采用推送方式来传输消息;针对不同的数据中心设置异地配置策略,设置需要同步的数据中心或数据中心的组合;底层传输采用HTTP协议和自定义序列化反序列化框架;最后基于消息组件实现数据的同步或更新、恢复以及移除,在实现时采用错误重试机制。本发明可实现消息的实时传递和处理,实现对一个点、多个点同时的数据推送、恢复和删除,确保更新、删除后的数据一致性,保证数据的跨地域同步的可靠性和安全性。
-
-
-
-