一种基于长读数和contig分类的scaffolding方法

    公开(公告)号:CN108830047A

    公开(公告)日:2018-11-16

    申请号:CN201810642753.0

    申请日:2018-06-21

    Abstract: 本发明公开了一种基于长读数和contig分类的scaffolding方法。本方法首先把长读数比对到contig集合上,根据比对结果生成局部scaffold集合。一条局部scaffold是由比对到同一条长读数的contig构成。基于每条contig在局部scaffold中出现的位置信息,把所有的contig分成两类,一类是重复contig,另一类是非重复contig。构建只包含非重复contig的scaffold图,图中每一个节点代表一个非重复contig。接着利用线性规划方法消除scaffold图中的方向和顺序冲突,并使scaffold图中只包含简单路径,其中每条简单路径对应一条scaffold。然后把重复contig插入到scaffold中,形成最终的scaffolding结果。本发明简单易用,在不同的真实数据上表现出良好的scaffolding结果,较其它scaffolding方法具有更高的准确性和连续性。

    一种基于近邻特征传播标签的社区发现方法

    公开(公告)号:CN108491449A

    公开(公告)日:2018-09-04

    申请号:CN201810158349.6

    申请日:2018-02-25

    Abstract: 本发明提出一种基于近邻特征传播标签的社区发现方法,该方法引入标签预分配机制,对随机初始化的标签进行局部优化;在传播过程中,按照影响力的高低顺序更新各节点的标签,摒弃了原方法中按随机顺序更新节点标签的做法,能展现出更好的稳定性和更高的准确性。本发明方法引入了标签预分配机制,根据各个标签在近邻节点中出现的次数、近邻节点的影响力和节点间的紧密度三个因素对初始化结果进行优化,在优化基础上进行标签传播,降低或消除了随机初始化的结果对社区划分结果的影响。此外,该方法在传播过程中按照影响力由高到低的顺序计算并更新各节点的标签,减少了对各节点标签的反复更新。

    一种基于WIFI技术的井下智能移动终端系统

    公开(公告)号:CN102655630A

    公开(公告)日:2012-09-05

    申请号:CN201110440211.3

    申请日:2011-12-19

    Abstract: 本发明提供了一种基于WIFI技术的井下智能移动终端系统,包括井上应用服务器,井上数据库服务器,PC控制端,交换机,路由器,井下无线AP和具有WIFI功能的移动终端;井上应用服务器实现和所述移动终端的连接和数据传递,并且用于实现井下人员定位服务和生产及安全信息查询服务功能;所述移动终端可以通过WIFI模块与井上应用服务器建立连接,通过访问应用服务器查询井下生产和安全信息,还可以定期扫描并发送周围的井下无线AP的信号强度到所述井上应用服务器,并可查询当前位置和调用巷道地图实现逃生导航功能。本发明集双向通信、安全和生产信息采集和双向传输监控、人员目标定位、逃生导航等功能于一身,为井下作业生产安全提供了重要保障。

    一种云计算的海量文档相似检测方法

    公开(公告)号:CN110516212B

    公开(公告)日:2022-10-28

    申请号:CN201910821968.3

    申请日:2019-09-02

    Abstract: 本发明公开一种云计算的海量文档相似检测方法,借助于分布式文件系统和并行数据库,搭建云计算环境,然后将待检测海量文档集上传到并行数据库,语料库中文本‑术语关系集使用键值对方式保存到并行关系数据库;待检测文本经过去停用词、分词等预处理后,通过特征提取后获得其特征向量,然后与并行数据库中语料库的特征向量进行相似度计算,产生相似度值;本发明适用于海量数据集的文本去重,具有运行效率高、运行时间短的优点,解决了传统相似检测技术不能适用于海量文本数据集的缺陷。

    一种基于约束的种子节点数据挖掘系统

    公开(公告)号:CN111221875A

    公开(公告)日:2020-06-02

    申请号:CN202010008842.7

    申请日:2020-01-06

    Abstract: 本发明针对种子节点选择过程中存在的性能问题和影响力重叠问题,提出一种基于约束的种子节点数据挖掘系统。该系统包括影响力计算装置、候选种子筛选装置和重叠开销检查装置。影响力计算装置计算节点影响力;候选种子筛选装置以节点影响力为输入筛选出候选种子节点;重叠开销检查装置计算候选种子节点与已有种子节点的重叠开销,并选出种子节点。本发明提出了有限贪婪的种子选择思想,在有限的邻居间以贪婪方式识别出影响力最大的节点,即保留了贪婪方式能获取接近最优结果的长处,又降低了本发明的时间复杂度。本发明还提出了重叠开销计算模型,根据重叠开销决定一个候选种子节点能否成为种子节点,以此降低由影响力重叠引起的传播效率缩水。

    一种基于延时策略的能耗及负载敏感的虚拟机整合方法

    公开(公告)号:CN106598693B

    公开(公告)日:2020-07-28

    申请号:CN201610310483.4

    申请日:2016-05-11

    Abstract: 本发明提出了一种基于延时策略的能耗及负载感知的虚拟机整合方法,该方法包括:设置轻载阈值、过载阈值和标志阈值;周期性预测服务器的负载;选择重新运行迁移虚拟机的服务器。在该方法中,依据一个特殊的负载阈值,将迁移操作标记为紧急和非紧急。如果一个迁移操作被标记为紧急,它应该立即执行。反之,如果被标记为非紧急,它将被推迟执行。如此,通过一小段的时间延迟,由预测模型的误差引起的迁移警报会随着时间的推移而消失,相应的迁移操作不会被执行,从而避免了额外的能源消耗和给系统性能带来的不利影响。此外,在选择服务器运行迁移的虚拟机时,引入了负载检测机制,避免一个服务器因运行迁入的虚拟机而负载过重,进而引起新的虚拟机迁移操作。

    一种云计算的海量文档相似检测方法

    公开(公告)号:CN110516212A

    公开(公告)日:2019-11-29

    申请号:CN201910821968.3

    申请日:2019-09-02

    Abstract: 本发明公开一种云计算的海量文档相似检测方法,借助于分布式文件系统和并行数据库,搭建云计算环境,然后将待检测海量文档集上传到并行数据库,语料库中文本-术语关系集使用键值对方式保存到并行关系数据库;待检测文本经过去停用词、分词等预处理后,通过特征提取后获得其特征向量,然后与并行数据库中语料库的特征向量进行相似度计算,产生相似度值;本发明适用于海量数据集的文本去重,具有运行效率高、运行时间短的优点,解决了传统相似检测技术不能适用于海量文本数据集的缺陷。

    一种基于延时策略的能耗及负载感知的虚拟机整合方法

    公开(公告)号:CN106598693A

    公开(公告)日:2017-04-26

    申请号:CN201610310483.4

    申请日:2016-05-11

    Abstract: 本发明提出了一种基于延时策略的能耗及负载敏感的虚拟机整合方法,该方法包括:设置轻载阈值、过载阈值和标志阈值;周期性预测服务器的负载;选择重新运行迁移虚拟机的服务器。在该方法中,依据一个特殊的负载阈值,将迁移操作标记为紧急和非紧急。如果一个迁移操作被标记为紧急,它应该立即执行。反之,如果被标记为非紧急,它将被推迟执行。如此,通过一小段的时间延迟,由预测模型的误差引起的迁移警报会随着时间的推移而消失,相应的迁移操作不会被执行,从而避免了额外的能源消耗和给系统性能带来的不利影响。此外,在选择服务器运行迁移的虚拟机时,引入了负载检测机制,避免一个服务器因运行迁入的虚拟机而负载过重,进而引起新的虚拟机迁移操作。

Patent Agency Ranking