-
公开(公告)号:CN118966210B
公开(公告)日:2025-03-07
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-
公开(公告)号:CN114253929A
公开(公告)日:2022-03-29
申请号:CN202111350519.9
申请日:2021-11-15
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/182 , G06F16/178 , G06F16/176 , G06F16/172 , G06F16/16
Abstract: 本发明涉及一种基于分布式文件存储的网盘系统架构,属于计算机软件领域。本发明建立了目录、文件的逻辑映射模型。相较于业务系统自身的文件管理,本发明提供了更加灵活清晰的树状分层管理结构,支持新建、删除、复制、移动等近本地化操作,同时支持文件上传、分享、下载操作。通过分块上传、并行机制、断点续传和闪传技术,大大提高文件传输速度和成功率,减少文件传输时间和成本。以用户为管理对象,提供文件统一存储和管理,支持不同范围文件共享,提高文件复用率,达到一文多用的目的,支持用户存储容量的灵活配置,减少前期存储资源投入和浪费。
-
公开(公告)号:CN118966210A
公开(公告)日:2024-11-15
申请号:CN202411446984.6
申请日:2024-10-16
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/284 , G06F40/216 , G06F40/295 , G06N3/0455 , G06N3/0475 , G06N3/096 , G06F18/214 , G06F18/22
Abstract: 本发明涉及一种基于迁移学习的自适应文档选择摘要生成方法,属于人工智能领域。本发明为解决人工智能辅助档案编研的问题,利用基于词分布的文档选择方法和基于摘要趋势的文档选择方法对源文档和档案的少量训练文档进行过滤,筛选出训练数据训练第一词向量生成器,得到基础摘要生成模型;通过自适应文档选择方法对源文档和测试文档进行筛选,根据测试文档的特征,选择出与之相关性强的源文档训练第二词向量生成器,优化基础摘要生成模型,构建定制摘要生成模型,更为精准地满足具体档案类别的需求。本发明能实现摘要自动生成,促进档案智能化,能去除档案负迁移,增加摘要相关性,能实现摘要定制化,提高摘要准确性。
-
公开(公告)号:CN114253929B
公开(公告)日:2024-04-05
申请号:CN202111350519.9
申请日:2021-11-15
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/182 , G06F16/178 , G06F16/176 , G06F16/172 , G06F16/16
Abstract: 本发明涉及一种基于分布式文件存储的网盘系统架构,属于计算机软件领域。本发明建立了目录、文件的逻辑映射模型。相较于业务系统自身的文件管理,本发明提供了更加灵活清晰的树状分层管理结构,支持新建、删除、复制、移动等近本地化操作,同时支持文件上传、分享、下载操作。通过分块上传、并行机制、断点续传和闪传技术,大大提高文件传输速度和成功率,减少文件传输时间和成本。以用户为管理对象,提供文件统一存储和管理,支持不同范围文件共享,提高文件复用率,达到一文多用的目的,支持用户存储容量的灵活配置,减少前期存储资源投入和浪费。
-
公开(公告)号:CN119026601A
公开(公告)日:2024-11-26
申请号:CN202411515203.4
申请日:2024-10-29
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F40/284 , G06F40/30 , G06N3/0442 , G06N3/08 , G06F16/35 , G06F18/10 , G06F18/241
Abstract: 本发明涉及一种基于改进LSTM语义建模的档案关键要素识别与分类方法,属于人工智能领域。本发明为解决当前档案数字化加工中存在的分类精度不足、要素提取效率低下的问题,采用LSTM模型的多层次结构捕捉文本中的局部与长距离语义特征,使得复杂档案内容的理解更加全面;采用自适应学习机制根据不同档案类型动态调整记忆单元的权重,确保在面对不同语义结构时,关键要素识别的精度保持在高水平;结合上下文感知的记忆与遗忘机制,模型在识别关键要素时能够减少噪音干扰,进一步提高分类的准确性。本发明不仅能够应对多样化、复杂化的档案内容,还能在处理大量数据时保持高效运行,极大地提高了档案数字化加工的质量和效率。
-
公开(公告)号:CN118964703A
公开(公告)日:2024-11-15
申请号:CN202411433979.1
申请日:2024-10-15
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/906 , G06F16/33 , G06F16/35 , G06F16/903 , G06F18/23 , G06F18/24
Abstract: 本发明涉及一种基于改进的BIRCH算法的数字档案分类系统,属于计算机软件领域。本发明为解决传统档案管理系统在面对海量档案数据时,分类实时性不足、分类标准难以适应动态变化以及大规模数据处理效率低下等问题,通过引入在线聚类机制,在新数据输入时实时更新聚类结果,无需重新扫描整个数据集。本发明改进了BIRCH算法的聚类特征树(CF树)更新策略,BIRCH算法进行一次全文扫描,将扫描结果生成的CF树保存以便后续使用,从而有效地对新输入的数字档案进行分类。与传统方法相比,这种优化不仅提高了系统的扩展性,还显著减少了计算资源的消耗,提升了分类的实时性。
-
-
-
-
-