一种公文特征提取方法、装置、设备和介质

    公开(公告)号:CN112686012A

    公开(公告)日:2021-04-20

    申请号:CN202011253863.1

    申请日:2020-11-11

    Abstract: 本发明公开了一种公文特征提取方法,包括:公文提取模板定义过程和公文特征提取过程;通过可扩展标记语言自定义公文提取模板,所述公文提取模板包括:附件提取标识标签、拆分句子规则标签以及至少一个提取特征字段标签;然后根据公文提取模板中的附件提取标识标签,获取公文正文或公文正文及附件作为待提取公文,将待提取公文转化为用可扩展标记语言格式内容;根据拆分句子规则标签将待提取公文进行句子拆分;根据提取特征字段标签逐句进行特征字段提取并输出。本发明提供的一种公文特征提取方法、装置、设备和介质,通过定义公文特征提取模版,以搭积木的方式实现对非结构化公文的特征提取,大大简化对公文特征提取的难度。

    协同数据处理方法和系统
    68.
    发明授权

    公开(公告)号:CN105608190B

    公开(公告)日:2020-02-28

    申请号:CN201510979149.3

    申请日:2015-12-23

    Abstract: 发明人提供了一种协同数据处理方法,包括如下步骤:保持第一区服务器和第二区服务器的数据同步;置第一区服务器为对第一区数据可读可写状态、对第二区数据可写状态;以及,置第二区服务器为对第一区数据可写状态、对第二区设备可读可写状态;当检测到第一区服务器发生预定程度以上的数据破坏时,将第二区服务器对第一区数据可写状态置为对第一区数据可读可写状态;或当检测到第二区服务器发生预定程度以上的数据破坏时,将第一区服务器对第二区数据可写状态置为对第二区数据可读可写状态。上述技术方案同步速度快、可完整提供业务服务并满足双中心数据一致的协同数据处理方案。

Patent Agency Ranking