-
公开(公告)号:CN119026601A
公开(公告)日:2024-11-26
申请号:CN202411515203.4
申请日:2024-10-29
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/08 , G06F16/35 , G06F18/10 , G06F18/241
Abstract: 本发明涉及一种基于改进LSTM语义建模的档案关键要素识别与分类方法,属于人工智能领域。本发明为解决当前档案数字化加工中存在的分类精度不足、要素提取效率低下的问题,采用LSTM模型的多层次结构捕捉文本中的局部与长距离语义特征,使得复杂档案内容的理解更加全面;采用自适应学习机制根据不同档案类型动态调整记忆单元的权重,确保在面对不同语义结构时,关键要素识别的精度保持在高水平;结合上下文感知的记忆与遗忘机制,模型在识别关键要素时能够减少噪音干扰,进一步提高分类的准确性。本发明不仅能够应对多样化、复杂化的档案内容,还能在处理大量数据时保持高效运行,极大地提高了档案数字化加工的质量和效率。
-
公开(公告)号:CN118964703A
公开(公告)日:2024-11-15
申请号:CN202411433979.1
申请日:2024-10-15
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/906 , G06F16/33 , G06F16/35 , G06F16/903 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于改进的BIRCH算法的数字档案分类系统,属于计算机软件领域。本发明为解决传统档案管理系统在面对海量档案数据时,分类实时性不足、分类标准难以适应动态变化以及大规模数据处理效率低下等问题,通过引入在线聚类机制,在新数据输入时实时更新聚类结果,无需重新扫描整个数据集。本发明改进了BIRCH算法的聚类特征树(CF树)更新策略,BIRCH算法进行一次全文扫描,将扫描结果生成的CF树保存以便后续使用,从而有效地对新输入的数字档案进行分类。与传统方法相比,这种优化不仅提高了系统的扩展性,还显著减少了计算资源的消耗,提升了分类的实时性。
-
公开(公告)号:CN117456536A
公开(公告)日:2024-01-26
申请号:CN202311397890.X
申请日:2023-10-26
Applicant: 北京计算机技术及应用研究所
IPC: G06V30/148 , G06N3/0464 , G06N3/0442 , G06N3/045 , H04L67/06 , H04L67/01 , G06V10/80 , G06V10/82 , G06V30/19
Abstract: 本发明涉及一种基于深度学习的电子公文归档系统设计方法,属于计算机软件领域。本发明利用超分辨率增强版式电子公文特征,利用改进的改进的区域卷积神经网络提取文件流式信息,利用预训练BERT模型挖掘流式信息语义特征,利用卷积神经网络和长短时记忆网络对语义特征进行分类归档的电子公文归档系统设计,省去了传统分类归档系统标记文单要素的繁琐步骤,在提高效率的同时挖掘更深层次的电子公文主题特征。
-
-