一种大规模序列数据的解析处理方法及装置

    公开(公告)号:CN116431700A

    公开(公告)日:2023-07-14

    申请号:CN202310267230.3

    申请日:2023-03-15

    Abstract: 本发明公开了一种大规模序列数据的解析处理方法及装置。本方法为:1)遍历所有待解析处理的序列文件,将文件路径、大小、类型记录到主队列中;2)选取多个解析服务器并在每一所述解析服务器上部署一解析进程,用于向主队列发送解析请求;主队列接到解析请求后,为对应的解析服务器创建一个工作队列,将分配给该解析服务器的序列文件集合Fi迁移至所述工作队列中;3)第i个解析服务器开始解析序列文件集合Fi中的第j个序列文件Fij时,将开始解析时间以及解析Fij的进程标识记录到Fij中;4)第i个解析服务器将Fij的解析结果存储于中间文件中;5)将不同中间文件路径写入不同队列并监听,将对应的中间文件存入数据库。

    大型系统进化树的加速方法及装置

    公开(公告)号:CN115691656A

    公开(公告)日:2023-02-03

    申请号:CN202211241923.7

    申请日:2022-10-11

    Abstract: 本发明公开了一种大型系统进化树的加速方法及装置,所述方法包括:获取系统进化树中所有节点的属性;基于横向坐标和纵向坐标,对系统进化树的叶子节点进行聚类,以获取离群点和节点簇;在一个节点的子孙叶节点全部属于一个所述节点簇,且所述子孙叶节点的数量不小于一数量阈值的情况下,将该节点作为一新的叶节点,且将所述子孙叶节点的所述可见状态设置为当前节点不可见,以得到新的系统进化树;针对所述新的系统进化树,通过判断每一叶子分支是否因被其它节点覆盖而导致不可见,获取该叶子分支中各节点的可见状态,以生成所述系统进化树的加速结果。本发明避免了大型系统进化树可视化时扎堆折叠的现象。

Patent Agency Ranking