-
公开(公告)号:CN119832292A
公开(公告)日:2025-04-15
申请号:CN202411730876.1
申请日:2024-11-29
Applicant: 北京计算机技术及应用研究所
IPC: G06V10/764 , G06N3/0464 , G06V10/32 , G06V10/30 , G06V10/44 , G06V10/80
Abstract: 本发明涉及一种基于非对称密集卷积神经网络的轻量化通信设备检测方法,属于人工智能、计算机视觉、目标检测技术领域。本发明设计了一种双路非对称密集层,在不增加计算成本的情况下将单个非线性激活层分解为两层来设计非对称的深度可分离卷积,基于此构建双路非对称密集层,以此增强轻量化网络的特征提取和信息表达能力;设计了一种在特征合并过程中的通道混排机制,让该层能够在信息交换中保留特征细节并实现更平滑的层内信息流动,同时根据所给通道配置生成可变特征融合模式;引入密集连接的思想,实现层到层的信息流通与特征重用,从而促进了信息的高效传输。
-
公开(公告)号:CN119831030A
公开(公告)日:2025-04-15
申请号:CN202411730689.3
申请日:2024-11-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于领域数据配比的大语言模型知识注入方法,属于大语言模型、领域知识、自然语言处理技术领域。本发明设计了一个自我监督的持续预训练框架,该框架能够在不增加额外人工标注成本的情况下,利用选定的知识对LLMs进行知识增强;提出了一个基于同质性度量的知识筛选机制,用于从大规模知识图谱中精选与目标任务相关的高质量知识,有效提升了LLMs的领域感知。在多个低资源垂直领域的NER任务上进行了广泛的实验,实验结果验证了本方法的有效性,尤其是在提升模型对复杂实体类型识别能力方面表现出色。
-
公开(公告)号:CN119760061A
公开(公告)日:2025-04-04
申请号:CN202411726651.9
申请日:2024-11-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/3329 , G06F16/334 , G06F16/335 , G06F16/36 , G06N5/022 , G06N5/04
Abstract: 本发明涉及一种基于多层次语义推理的时序知识图谱问答方法,属于人工智能、自然语言处理以及知识图谱技术领域。本发明通过引入多层次的模块设计,包括问题分解、相关性排序和语义理解,有效提升系统在复杂时序问题上的问答能力。该方法利用大型语言模型的强大语义理解和推理能力,无需依赖额外的实体链接信息,能够在多时间粒度的复杂场景中提供准确的问答结果。通过采用问题分解与提示微调技术,本发明在提升问答系统性能的同时,增强了对复杂时序推理问题的处理能力,可以提高系统的准确性和鲁棒性。
-
-