一种针对竖排文本的检测方法及装置

    公开(公告)号:CN115410207B

    公开(公告)日:2023-08-29

    申请号:CN202110588830.0

    申请日:2021-05-28

    Abstract: 本发明公开一种针对竖排文本的检测方法及装置,包括扫描待检测文本,确定换行符的位置,得到一个位置列表,并基于该位置列表,计算每行文字长度;截取连续t行中每行文字长度一致的文本,保留截取文本中的有效字符,得到保留文本;对保留文本进行分词,并根据得到第一分词结果,获取截取文本的初步检测结果;若初步检测结果判断截取文本为竖排文本,则将截取文本转换为二维的字符矩阵,并删除换行符,对该字符矩阵作转置,得到转置文本;对转置文本进行分词,并根据得到第二分词结果,获取截取文本的检测结果。本发明可确定竖排文字的区域,去除竖排文本中的干扰字符,并恢复成一般的横向文本,同时处理竖排文本中普遍存在的错别字现象。

    一种基于网络流量数据的故障诊断方法及系统

    公开(公告)号:CN109150619B

    公开(公告)日:2023-06-02

    申请号:CN201811036829.1

    申请日:2018-09-04

    Abstract: 一种基于网络流量数据的故障诊断方法及系统,包括:基于预先构建的链路流量异常故障传播模型查找所有可能导致故障网络设备发生链路流量异常故障事件的待分析网络设备;基于网络流量数据和预先构建的链路流量异常检测模型,获得待分析网络设备发生的链路流量异常故障事件;基于待分析网络设备发生的链路流量异常故障事件获得原因网络设备和原因网络故障。本发明基于网络链路流量监测数据和网络拓扑数据,实现网络链路流量异常故障自动发现和原因分析诊断的分析处理框架,基于该框架可以实现海量流量数据异常自动分析发现和原因自动诊断。

    一种自然语言文本的惯用句式提取方法及电子装置

    公开(公告)号:CN113779961A

    公开(公告)日:2021-12-10

    申请号:CN202010518026.0

    申请日:2020-06-09

    Abstract: 本发明提供一种自然语言文本的惯用句式提取方法及电子装置,包括:对采集到的每一语句进行分词、词性标注及依存句法分析;将各语句转换为若干单句,并依据词性标注结果与依存句法分析结果,对各单句主干进行抽取,将各单句表示为词汇和词性标签的列表;将各单句的列表进行合并,得到各语句的惯用句式。本发明提出一种不损失句式信息的长难句化简方法,针对句式提取的需要对中文长难句中非句子主干部分进行处理,提高句式提取准确度,本发明还提出一种句式信息表示结构,使用词汇、词汇候选集、词性标签来表示句式信息,保留尽可能多的句式信息。

    时间序列异常处理方法、装置、电子设备及存储介质

    公开(公告)号:CN112905671A

    公开(公告)日:2021-06-04

    申请号:CN202110313319.X

    申请日:2021-03-24

    Abstract: 本发明提供一种时间序列异常处理方法、装置、电子设备及计算机可读存储介质。其中,时间序列异常处理方法,包括步骤:获取时间序列数据,对所述时间序列数据训练,构建模型;根据所述模型检测实时获得的时间序列数据中是否存在异常数据,若存在,则推荐部分异常数据;判断被推荐的所述部分异常数据是否合理,然后反馈判断结果;根据所述判断结果优化所述模型,然后继续检测实时时间序列数据。根据本发明的时间序列异常处理方法,对数据没有明显的偏向性,能够适配具有特定场景语义的指标,能应对非传统互联网领域的运维需求,具有更高的可扩展性,具有普适性,给出的异常结果能够给出具体的异常原因。

    一种服务器运行时状态的跨层度量方法及系统

    公开(公告)号:CN107957934A

    公开(公告)日:2018-04-24

    申请号:CN201711050056.8

    申请日:2017-10-31

    CPC classification number: G06F11/3409 G06K9/6218 G06K9/6272

    Abstract: 本发明涉及一种服务器运行时状态的跨层度量方法及系统,将预先采集的目标服务器数据转换成变化向量,并将变化向量转换成余弦空间的点;对余弦空间的点进行聚类,得到所有时刻的分类数,并计算每个分类的类中心位置和边界;将余弦空间的点作为输入计算目标服务器的余弦空间的点所属类,将类中心位置作为输入计算目标服务器的变化向量到所属类的类内距离;根据目标服务器的余弦空间的点所属类和类内距离,得出服务器的运行时健康度状态。本发明解决了当前服务器状态模型主要以当前资源利用率和已发生的告警作为输入,难以追踪健康度变化过程,不具备服务器提前预警的能力。

    匿名通信系统的可调节机制方法及系统

    公开(公告)号:CN103095575B

    公开(公告)日:2018-04-06

    申请号:CN201210591568.6

    申请日:2012-12-28

    Abstract: 本发明提供了一种匿名通信系统的可调节机制方法及系统,所述方法包括:S1.对匿名通信系统进行建模,修改路径选择算法;S2.各个用户根据对匿名度和性能的要求,在匿名度由高到低而性能由低到高的A、B、C、D、E5个可调节选项中进行选择;S3.匿名通信系统根据用户选择的不同可调节选项,在路径选择算法中使用不同的路径长度,构建匿名路径;S4.用户可以更改可调节选项,匿名通信系统则相应调整其匿名通信路径的路径长度;所述系统包括:依次连接的建模模块、可调节选项模块、路径选择模块和更新模块。本发明提供的匿名通信系统的可调节机制方法及系统,通过控制路径长度提供匿名度和性能的可调节机制,满足不同用户的不同需求,提高系统可用性。

    一种老化感知的任务调度系统

    公开(公告)号:CN104965763A

    公开(公告)日:2015-10-07

    申请号:CN201510432304.X

    申请日:2015-07-21

    Abstract: 本发明提供一种老化感知的任务调度系统,所述任务调度系统包括老化探测模块、软件再生模块、任务调度模块、调度策略模块和资源信息库模块;所述老化探测模块与资源信息库模块双向连接,所述资源信息库模块与软件再生模块和任务调度模块均单向连接,所述调度策略模块与任务调度模块单向连接。本发明提供一种老化感知的任务调度系统,在任务调度和运行时,能够实时感知资源节点的老化状态,及时恢复资源节点的服务能力,提高了任务执行效率。

    一种面向混合任务的调度系统

    公开(公告)号:CN104965762A

    公开(公告)日:2015-10-07

    申请号:CN201510432283.1

    申请日:2015-07-21

    Abstract: 本发明提供一种面向混合任务的调度系统,包括模型解析器、执行序列生成器、信息收集器和代理模块;模型解析器与执行序列生成器单向连接,执行序列生成器与信息收集器和代理模块之间均双向连接。本发明提供的面向混合任务的调度系统,任务调度时考虑了任务执行的周期性时序特征,即对于需要长时间不间断运行的任务可实现“一次调度、多次运行”,避免了对一类任务的频繁调度、下发,降低了任务调度带来的额外计算成本,极大降低了任务的频繁下发给网络通信带来的压力;并将如何为同一组周期性任务分配最少的资源来执行看作一个背包问题,提出了相应的算法,以求得最小的虚拟资源集合来完成任务的执行。

    一种海量非结构化数据的数据存储方法

    公开(公告)号:CN104731864A

    公开(公告)日:2015-06-24

    申请号:CN201510088785.7

    申请日:2015-02-26

    CPC classification number: G06F17/30628 G06F17/30132

    Abstract: 本发明公开了一种海量非结构化数据的数据存储方法。本方法为:1)设定一时间间隔T,将数据存储集群划分为多个分区,用于将同一时间间隔T内的记录存储到同一分区内;同时将每一分区划分为n个散列区;2)对于每条非结构化记录,提取其产生的时间t以及一个或多个唯一表示该记录的关键信息key;3)根据每条记录的时间t,确定其要存储到的分区,然后根据该记录的关键信息key计算其在该分区中对应的散列区值;4)根据步骤3)的计算结果,将属于同一时间间隔且散列区值相同的记录写入同一文件F中并统计该文件F的记录数,如果记录数大于设定阈值K,则在当前散列区中创建另一文件进行存储。本发明存储方法能够大大提升了数据检索效率。

Patent Agency Ranking