-
公开(公告)号:CN110647353B
公开(公告)日:2023-04-28
申请号:CN201910846500.X
申请日:2019-09-09
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种本发明一种无监督的软件复杂度评估方法,其中,包括:步骤一、针对软件程序复杂度的度量,总结提炼常用的程序复杂度度量元;步骤二、基于高斯混合模型的度量元概率归一化,包括:首先,针对数据中的各个度量元的频率分布,使用无监督的最大期望算法进行高斯混合建模,拟合该度量元的概率密度函数,基于该度量元的概率密度函数计算其累积分布函数,使用累积分布函数的值作为该度量元的归一化处理后的数值;步骤三、评估基于AOV网络的软件复杂度。
-
公开(公告)号:CN110704316A
公开(公告)日:2020-01-17
申请号:CN201910917842.6
申请日:2019-09-26
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明公开了一种国产环境下办公软硬件测试方法,首先在云化服务器上对办公软件集进行模板化分解并建立服务集合库;其次将云化服务器上的服务集合库进行服务组装,形成多个评测场景;然后对于每一个评测场景,使用不同的测试工具集对其进行评测,通过自动化脚本生成器完成不同测试场景所要求的自动化脚本的评测参数设置和数据注入;执行自动化评测脚本;将自动化脚本之后的结果进行收集与比对,输出评测结果。本发明把测试基准移植到国产化操作平台,实现了计算机软硬件系统的并发测试,并将软件细粒度模块组合设计了不同测试场景,使用自动化评测脚本工具增强了评测的自动化程度。
-
公开(公告)号:CN110532557A
公开(公告)日:2019-12-03
申请号:CN201910807636.X
申请日:2019-08-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种无监督的文本相似度计算方法,其中,包括:步骤一:进行嵌入层模型预训练,对问题集合中的所有词进行预训练,生成满足模型需要的词向量;步骤二:编码层网络,挖掘句子的语义信息;步骤三:进行基于TFIDF融合的模型改进,包括:在每条问句输入到神经网络的同时,对输入的每条问句进行TFIDF的计算,并将计算好的权值输入到神经网络中,控制最后的句子向量表示,采用了归一化的TFIDF计算方法,并将其融入到编码层和表示层。本发明将深度神经网络模型(Bi-LSTM)用于语料库的无监督训练,得到语言模型,通过无监督的训练方式,可以充分地利用大规模的语料库的信息,从而提高文本匹配的准确率,提升信息检索的精度。
-
公开(公告)号:CN109656818A
公开(公告)日:2019-04-19
申请号:CN201811477290.3
申请日:2018-12-05
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种软件密集系统故障预测方法,其中,包括:步骤一、构建特征向量;步骤二、通过获得的特征向量,训练时间序列预测法模型,并输出时间序列预测法模型的特征向量,用训练好的时间序列预测法模型对下一时刻系统硬件信息进行预测;步骤三、构建基于随机深林算法的故障预测模型,将步骤二中得到时间序列预测法模型的特征向量,输入随机森林模型中,得到软件故障的预测结果。本发明方法不依赖于人工确认及个人分析经验,通过实际观测数据进行智能预测,预测结果更为客观。
-
公开(公告)号:CN117390157B
公开(公告)日:2025-05-06
申请号:CN202311341725.2
申请日:2023-10-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/3329 , G06F16/36 , G06F16/35 , G06F40/30
Abstract: 本发明涉及一种基于门控主题模型的无监督关键词抽取方法,属于人工智能、大数据、自然语言处理领域。本发明提出了一种语义自适应的文档语义表示方法,在整个语料库上训练一个神经主题模型来挖掘该领域的相关主题,并采用门控机制对文档主题进行独立加权,使具有较高语义丰富度的文档被分配相对更多的主题;利用文档主题信息设计了一种新的关键词评分算法,同时考虑了主题相似度与主题重要度对关键词评判的影响。通过这两方面因素的折衷,避免了对文本核心主题的过度关注,从而提高了所抽取关键词的多样性。
-
公开(公告)号:CN119557446A
公开(公告)日:2025-03-04
申请号:CN202411573000.0
申请日:2024-11-06
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/353 , G06N3/0455 , G06N3/0475 , G06N3/094 , G06N3/092 , G06N3/084 , G06N3/09 , G06N5/04
Abstract: 本发明涉及一种基于细粒度博弈对抗的生成文本检测方法,属于生成文本检测技术领域。本发明的方法通过生成器和判别器的博弈对抗训练,构建高精度AI生成文本判别器。判别器的构建包括:初始化生成器和判别器;构造判别器训练集;训练判别器分类人类文本、AI文本和混合文本;根据判别结果优化生成器生成策略与生成内容;生成器与判别器交替训练直到损失收敛;损失函数的设计综合考虑了判别器反馈和文本质量指标,以优化生成器生成文本的逼真度和自然性。通过该方法,本发明提升了AI生成文本检测的准确性和鲁棒性,具有广泛的应用前景。
-
公开(公告)号:CN116757221A
公开(公告)日:2023-09-15
申请号:CN202310694489.6
申请日:2023-06-13
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/216 , G06F40/289 , G06F40/211 , G06F16/35 , G06F16/33
Abstract: 本发明涉及一种基于事件抽取的情报态势挖掘方法,属于信息抽取/态势感知领域。本发明通过已有的情报态势文本数据,抽取其中情报领域相关词汇,依据领域词的类别和频次,将情报态势文本数据分类为事件场景类型库。针对不同事件场景类型,设计事件模板,依据事件模板抽取情报态势文本数据中的事件要素,形成事件列表。依据事件要素对情报态势序列数据进行检索,关联匹配相似属性,形成情报态势库。本发明解决大量情报文本和态势序列中情报态势的挖掘问题。
-
公开(公告)号:CN115017293A
公开(公告)日:2022-09-06
申请号:CN202210566870.X
申请日:2022-05-23
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/335
Abstract: 本发明涉及一种基于LDA主题模型的文档推荐方法,属于信息技术领域。本发明使用了LDA主题模型将每个文档进行向量化,并输出该文档的主题概率,将推荐系统中的所有文档主题概率结合起来便能得到一个文档对主题的矩阵。另一方面,通过给新用户初始化来赋予每个用户一个主题概率,并使用户主题概率的维度与文档主题概率的维度保持一致,然后将所有用户主题概率结合起来得到一个用户对主题的矩阵。最后,通过用户和文档的两个主题概率矩阵,计算出用户对文档的兴趣值并将相应文档推荐给用户。这种推荐方法可以广泛运用在文档推荐系统中,并适用于各类文档。
-
公开(公告)号:CN114881032A
公开(公告)日:2022-08-09
申请号:CN202210462583.4
申请日:2022-04-28
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F16/35 , G06N3/04 , G06N3/08
Abstract: 本发明涉及一种基于多任务学习的层次类别命名实体识别模型设计方法,属于自然语言处理技术领域。本发明通过在命名实体识别模型中加入对于类别关系的建模,使得模型能够同时识别出命名实体的多个类别,同时,本发明提出了基于多任务学习的模型来解决具有层次类别的命名实体识别问题。模型使用多任务学习机制同时学习多个层次的命名实体识别任务,这些任务共享同一个编码层,这样可以使得编码层学习到的编码向量可以同时适应多个层次的命名实体识别而不是过拟合于某一个单独的层次。最后,还分别设计了两种信息传递机制传递不同层次间的识别信息,以提高模型的识别效果。
-
公开(公告)号:CN111881055A
公开(公告)日:2020-11-03
申请号:CN202010775179.3
申请日:2020-08-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F11/36
Abstract: 本发明涉及一种军用软件评测规范的Simulink模型设计方法,其中,包括:分解出Simulink自带规则检查工具Model Advisor中直接影响代码标准符合性的模型检查项;收集Simulink模型进行成分分析,并使用Model Advisor中直接影响代码标准符合性的模型检查项进行规则检查,将通过规则检查的模型入库;将GJB 8114强制类准则逐项分解为由代码生成器决定和由用户行为决定的两类,利用假设检验方法对该两类准则进行验证;将得到的Model Advisor中直接影响代码标准符合性的模型准则、需谨慎使用的Simulink模块集合、由用户行为决定的模型设计准则、基于Simulink自带的模块库的模型设计准则进行提炼和加工,形成Simulink模型设计准则。
-
-
-
-
-
-
-
-
-