-
公开(公告)号:CN103079259A
公开(公告)日:2013-05-01
申请号:CN201210538002.7
申请日:2012-12-13
IPC: H04W48/18
Abstract: 本发明公开了一种移动机会网络中网关选择方法,步骤是:计算相遇频率:由一个控制节点集中计算网络中每个节点同其他节点间平均相遇频率;基于中心度的候选网关选择:依次选择K个中心度最大的节点为候选网关;基于频繁轨迹的候选网关选择:对所有K个节点组合确定其对应的广播频繁轨迹,选择对应期望时延最低的为候选网关;基于蒙特卡洛模拟的网关选择:对基于中心度所得的候选网关、基于频繁轨迹所得的候选网关,利用蒙特卡洛模拟评估从它们开始的期望广播时延,选择时延更短的为最终所选的K个网关。跟传统移动无线网络中固定网关节点选择不同,本发明考虑了机会传输模式下的移动网关选择。移动网关的引入,可降低传统蜂窝接入网络的负载。本发明基于节点社会属性进行移动网关选择,可达到优化从网关出发数据传输速度的目标。
-
公开(公告)号:CN119807417A
公开(公告)日:2025-04-11
申请号:CN202411967701.2
申请日:2024-12-30
Applicant: 北京信息科技大学
Abstract: 本申请提供一种文本多标签分类方法、分类装置、电子设备及存储介质。该文本多标签分类方法,包括:将技术领域和需要分类的标签输入至大语言模型,以使大语言模型生成对应技术领域下每个标签的定义;使用大语言模型对文献数据进行标注,得到标注数据;使用所述标注数据对大语言模型进行LoRA微调,得到微调的模型,所述微调的模型用于多标签分类;基于每个标签的定义,利用所述微调后的模型,对文本进行多标签分类。该文本多标签分类方法,能够精准理解技术标签、学习文献中蕴含的知识,文献数据多标签分类任务的分类效果较好,大幅提高了文献数据多标签分类任务的分类准确性和分类效果。
-
公开(公告)号:CN119048791A
公开(公告)日:2024-11-29
申请号:CN202410210752.4
申请日:2024-06-14
Applicant: 北京信息科技大学
IPC: G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0464 , G06V10/44
Abstract: 本申请公开了一种多粒度图像分类方法、装置、电子设备及存储介质。该分类方法通过层次多粒度图像分类模型实现,该方法包括:获取多尺度信息的特征图;提取并融合不同层次粒度的特征向量,得到各个层次的多尺度融合特征向量;对各个层次的多尺度融合特征向量进行层次特征映射;将映射得到的特征向量与被映射的细粒度特征向量进行融合操作;层次多粒度图像分类模型的损失函数包括基于类别中心的三元组损失。本申请实施例的方法,增加了网络的局部细节信息,对各类别层次的多粒度特征进行融合,解决了层次间粗细粒度所对应的区域不同的问题,采用基于类别中心的三元组损失增强了图像的特征表示和提升了各层次粒度图像分类准确度。
-
公开(公告)号:CN116467619A
公开(公告)日:2023-07-21
申请号:CN202310206097.0
申请日:2023-03-06
Applicant: 北京信息科技大学
IPC: G06F18/24 , G06F18/214 , G06N3/0464 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及存储系统领域中的数据分类存储,通过挖掘数据访问的长周期季节特征,构建深度学习模型,实现数据分类并存储于不同性能的设备,以实现存储系统的高能效存储,包括以下步骤:(一)、对数据访问中的长周期季节特征进行分析;(二)、依据长周期季节特征确定数据类别数目;(三)、构建训练模型用的训练集和测试集;(四)、构建BERT‑RCNN模型抽取数据周期特征并完成分类。(五)、构建存储系统能耗和成本模型,得到分类存储的能耗和成本,以验证方法的有效性。本发明通过构建BERT‑RCNN分类模型,能够更有效地实现数据分类存储,降低存储能耗和成本。
-
公开(公告)号:CN116384402A
公开(公告)日:2023-07-04
申请号:CN202310415757.6
申请日:2023-04-18
Applicant: 华能煤炭技术研究有限公司 , 北京信息科技大学
IPC: G06F40/295 , G06F40/30 , G06F40/242 , G06F16/36 , G06F16/35 , G06N3/0442 , G06N3/08 , G06N3/084
Abstract: 本发明涉及煤矿机电设备领域,特别涉及一种融合机电设备本体库术语词结合对比学习的煤矿机电设备命名实体识别方法。该方法首先使用Word2Vec模型预训练机电设备术语词向量,并利用多术语多头注意力机制将术语词向量与字向量融合。然后采用Bi‑LSTM模型进行编码,在损失函数上采用对比学习做改进,将Bi‑LSTM计算的相对熵损失作为CRF损失的正则项。最后,利用CRF模型解码得到最优标签。实验结果表明,该方法在自构的煤矿机电设备语料上的准确率、召回率和F1值均优于现有主流方法。本发明的技术方案可以有效地识别煤矿机电设备领域中存在实体命名相似以及部分重点设备名称较长的问题,为智能矿山的构建提供了有力的支持。
-
公开(公告)号:CN115952802A
公开(公告)日:2023-04-11
申请号:CN202211001912.1
申请日:2022-08-21
Applicant: 华能煤炭技术研究有限公司 , 北京信息科技大学
IPC: G06F40/30 , G06F16/332 , G06F16/35 , G06N3/045 , G06N3/08
Abstract: 本发明涉及自然语言处理领域的文本处理方法,提升现有基于切分等方式处理长文本会产生信息丢失的不足,包括以下步骤:将文本按句子切分成多段内容;将每句话以[CLS]句子[SEP]的形式传入BERT预训练语言模型,获取最后一层隐藏层向量以及[CLS]对应向量;使用词注意力机制获得句子向量;获得原文所有句子的句子向量并拼接,以[SCLS]向量的形式传入transformer模型,获取最后一层隐藏层向量以及[SCLS]对应向量;使用句注意力机制获得文本向量;训练检索网络模型并更新参数,在测试集上提取文本特征并进行测试。本发明可获得更好的处理长文本,能够更为有效的提升长文本分类准确性,并且复杂度更低。
-
公开(公告)号:CN115270785A
公开(公告)日:2022-11-01
申请号:CN202210975168.9
申请日:2022-08-17
Applicant: 北京信息科技大学
IPC: G06F40/284 , G06F40/295 , G06F16/35 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本发明涉及自然语言处理领域的知识抽取技术,特别涉及对武器装备知识领域的三元组抽取,可以充分挖掘非结构化信息,缓解模型对样本标注的依赖。包括以下步骤:(一)、通过爬虫对舰船、飞机等信息进行了采集并持久化至容器。(二)、使用自编码方式结合自注意力机制对文本的双向上下文以获取特征向量;(三)、将特征向量投入结合多轮对抗攻击的头实体识别器将其识别为头实体或尾实体;(四)、针对不同的头实体类型获取到句子向量,以字为最小粒度进行融合;(五)、在关系尾实体识别模块,指定关系对应的实体识别;本发明可获得更好缓解武器装备领域遇到的单实体重叠问题和实体对重叠问题,实现对武器装备领域的复杂关系以及隐含关系进行抽取。
-
公开(公告)号:CN112784051A
公开(公告)日:2021-05-11
申请号:CN202110157625.9
申请日:2021-02-05
Applicant: 北京信息科技大学
IPC: G06F16/35 , G06F40/295 , G06F40/30 , G06N3/04 , G06N3/067
Abstract: 本申请公开了一种专利术语抽取方法,包括:利用BERT预训练语言模型层将被标注过的字符级语料的每个字符转化为词向量,将词向量输入到BiLSTM层进行语义编码,自动提取句子特征;利用CRF层解码输出概率最大的预测标签序列,得到每个字符的标注类型,对序列中的实体提取分类。本申请实施例提供的专利术语抽取方法,利用BERT对专业领域专利文本进行向量化,能有效提高术语抽取结果的准确率,抽取效果优于当前主流的深度学习术语抽取模型,在专业领域专利文本术语抽取中,准确率、召回率和F1值均有了显著提升,可以准确快速识别出字符较多的专业领域专利长序列术语。
-
公开(公告)号:CN112528661A
公开(公告)日:2021-03-19
申请号:CN202011470736.7
申请日:2020-12-15
Applicant: 北京信息科技大学
IPC: G06F40/295 , G06F40/30
Abstract: 本申请公开了一种实体相似度计算方法,包括:概念相似度计算步骤、距离相似度计算步骤、语义相似度计算步骤以及属性相似度计算步骤。所述概念相似度计算步骤为融合路径权重的实体概念相似度计算步骤。所述语义相似度计算步骤为基于Bert的语义相似度计算步骤。所述属性相似度计算步骤为基于TextRank的属性相似度计算步骤。本申请实施例提供的实体相似度计算方法,利用概念层次和距离来衡量实体之间的差异,利用语义和属性来衡量实体之间的共性,得到的正确率、召回率以及F1值较高,相较于传统的单独使用路径或者概念层次的方法取得了更好的效果。
-
公开(公告)号:CN112417853A
公开(公告)日:2021-02-26
申请号:CN202011470329.6
申请日:2020-12-15
Applicant: 北京信息科技大学
IPC: G06F40/258 , G06F40/211 , G06F40/30 , G06N3/04 , G06N3/08
Abstract: 本申请公开了一种中文专利摘要改写方法,包括:文档预处理;句子分布式表示;句子抽取。本申请实施例提供的中文专利摘要改写方法,通过引入专利术语词典,基于强化学习的句子抽取方法,抽取专利说明书文本的关键句,利用Transformer深度神经网络文本生成方法生成候选摘要,最终融合专利原始摘要信息,经过语义去重和排序得到改写摘要,实现了端到端的专利摘要改写,并且在ROUGE‑1、ROUGE‑2和ROUGE‑L评价标准上表现极佳,明显优于其他序列生成基准方法,有利于降低人工改写的成本,提高专利数据加工的工作效率。
-
-
-
-
-
-
-
-
-