-
公开(公告)号:CN115062147A
公开(公告)日:2022-09-16
申请号:CN202210690741.1
申请日:2022-06-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/35 , G06F40/295 , G06K9/62
Abstract: 本发明涉及一种融合命名实体频繁模式特征的篇章级文本事件分类方法,属于信息处理技术领域。本发明旨在挖掘出长文档中的核心特征并发现其关键词,并通过这些特征来对篇章级文本事件进行分类。同时本发明提出了融合命名实体频繁模式特征的分类模型来解决篇章级文本事件分类问题。分类模型通过泛化实体语义信息以增强提取到的特征的鲁棒性,同时结合频繁项集挖掘算法和信息增益指数来挖掘篇章级文本的关键特征。最后,使用朴素贝叶斯分类法对篇章级文本事件进行分类。
-
公开(公告)号:CN113535573A
公开(公告)日:2021-10-22
申请号:CN202110841584.5
申请日:2021-07-26
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种基于GOMS模型改进的软件可用性量化评估方法,属于软件评估领域。本发明基于GOMS模型改进的软件可用性量化评估方法,对于软件的不同业务采用专家打分法对业务的使用频率、重要程度进行打分,从而确定各个业务的权重;将业务目标分为几个子目标,子目标可以继续细分,直到分解成不能分解的基本操作;以GOMS模型基本操作时间为基础,计算出不同基本操作的复杂度;根据基本操作的复杂度,计算业务复杂度;根据软件系统各个业务的复杂度,得到软件系统的复杂度。本发明对于软件系统的不同设计方案,通过计算各方案的软件界面设计复杂度,软件界面设计的复杂度越高,软件可用性越差,由此即可实现各设计方案的软件可用性的量化评估。
-
公开(公告)号:CN117521666A
公开(公告)日:2024-02-06
申请号:CN202311451928.7
申请日:2023-11-03
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/30 , G06F40/211 , G06F40/117 , G06F16/33 , G06N3/0499 , G06N3/08
Abstract: 本发明涉及一种基于元学习扩散模型的限定域受限文本生成方法,属于人工智能、大数据、自然语言处理领域。本发明通过关键词抽取和在原始句子中随机插入特定的占位符标记[EMP],构造大量训练样本;采用局部扩散的方式固定关键词,从而使扩散模型能够完成Hard‑CTG任务,并引入元学习策略对扩散模型训练过程进行优化;引入了另外一个特殊的标记[SLOT]用以指示MDM进行插入的位置,在逆扩散过程中,[SLOT]所标识的位置会逐步由标准高斯噪声转换为一个实际的单词或[EMP],从而得到包含关键词输入的生成文本。本发明使得扩散模型可在条件文本生成领域发挥其强大的生成优势。
-
公开(公告)号:CN110532557A
公开(公告)日:2019-12-03
申请号:CN201910807636.X
申请日:2019-08-29
Applicant: 北京计算机技术及应用研究所
Abstract: 本发明涉及一种无监督的文本相似度计算方法,其中,包括:步骤一:进行嵌入层模型预训练,对问题集合中的所有词进行预训练,生成满足模型需要的词向量;步骤二:编码层网络,挖掘句子的语义信息;步骤三:进行基于TFIDF融合的模型改进,包括:在每条问句输入到神经网络的同时,对输入的每条问句进行TFIDF的计算,并将计算好的权值输入到神经网络中,控制最后的句子向量表示,采用了归一化的TFIDF计算方法,并将其融入到编码层和表示层。本发明将深度神经网络模型(Bi-LSTM)用于语料库的无监督训练,得到语言模型,通过无监督的训练方式,可以充分地利用大规模的语料库的信息,从而提高文本匹配的准确率,提升信息检索的精度。
-
-
-