-
公开(公告)号:CN110135493A
公开(公告)日:2019-08-16
申请号:CN201910400319.6
申请日:2019-05-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种新闻话题跟踪方法,将动态话题模型与BP神经网络相结合,先将时间-事件空间模型根据实际需要改变相应权值,再通过BP神经网络训练完成样本与结果的映射关系,并且通过将测试语料分为多份,动态地训练话题模型,不断更新模型中的关键词和它的权重,再重新训练神经网络,接着进行新的分类,完成事件跟踪。本发明在动态话题模型中引入自适应的更新策略,通过不断地更新话题模型解决了事件跟踪过程中出现的话题偏移造成的正确率下降的问题,能够达到较好的话题跟踪效果,可以很好地满足实际应用的需要。
-
公开(公告)号:CN110134925A
公开(公告)日:2019-08-16
申请号:CN201910404981.9
申请日:2019-05-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种一种中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合来计算文本相似度,包括:从专利文本中抽取出SAO三元组;计算SAO三元组中词语的相似度;计算SAO之间相似度;基于SAO计算专利文本相似度;把向量空间模型方法和基于SAO结构的方法进行融合。本发明提供的中文专利文本相似度计算方法,基于SAO结构和向量空间模型相融合的方法计算专利文本相似度,充分发挥了二者的优点,克服了二者的缺陷,得到了极佳的正确率、召回率和F值,可以很好地满足实际应用的需要。
-
公开(公告)号:CN109933804A
公开(公告)日:2019-06-25
申请号:CN201910236194.8
申请日:2019-03-27
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种融合主题信息与双向LSTM的关键词抽取方法,首先结合LDA与Skip-gram模型学习到词语的主题词向量表示,然后将词语的主题词向量作为双向LSTM模型的输入,充分利用双向LSTM模型的时间记忆特性同时对词语上文与下文主题语义信息建模,最终由softmax函数输出词语的标签预测概率,该方法能够充分利用不同距离的上下文语义信息对关键词进行预测,得到的正确率、召回率与F值均较好,取得了明显超越现有技术的关键词识别效果,可以很好地满足实际应用的需要。
-
公开(公告)号:CN109614038A
公开(公告)日:2019-04-12
申请号:CN201811403707.1
申请日:2018-11-23
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种多样化QoS约束的多速磁盘调度方法,根据不同的用户QoS要求,执行不同的调度算法;不同的调度算法分别对应为:基于时间优先的磁盘调度算法、基于代价优先的磁盘调度算法和基于效益函数的磁盘调度方法。本发明提供的多样化QoS约束的多速磁盘调度方法,包含了三种调度算法:基于时间优先的调度算法TPDS、基于代价优先的调度算法CPDS和基于效益函数的调度算法BFDS,具备多样化QoS约束的调度能力,能够在满足用户多样的服务质量要求的前提下,通过调度不同运行模式的磁盘进行数据存储,最大程度地降低系统的能耗,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105528340B
公开(公告)日:2018-12-21
申请号:CN201510863564.2
申请日:2015-12-02
IPC: G06F17/27
Abstract: 本发明涉及一种多动词汉语概念复合块的动词层次分类的方法,包括以下步骤:步骤1)对汉语句子进行词语切分和词性标记;步骤2)将所述句子分割为小句;步骤3)将所述小句中的多个动词进行层次划分;步骤4)将动词分为两类;步骤5)利用改进的CCC分析器对动词进行分析;步骤6)针对多动词的小句进行分析直到队列元素为空。本发明可以减少因动词的层次分析错误而导致的句子整体层次错误,从而提高组块分析的准确性,为后续进行复杂句的句法语义分析打下了很好的基础,可以很好地满足实际应用的需要。
-
公开(公告)号:CN108920456A
公开(公告)日:2018-11-30
申请号:CN201810611476.7
申请日:2018-06-13
Applicant: 北京信息科技大学
IPC: G06F17/27
Abstract: 本发明涉及一种关键词自动抽取方法,包括:抽取技术标准中的通用词,抽取候选关键词,针对候选关键词过滤通用词后,综合位置特征、词共现特征以及上下文语义特征计算候选关键词权重得分,根据候选关键词权重得分范围计算动态阈值,利用动态阈值确定结果关键词。本发明提供的关键词自动抽取方法,融合位置特征、词共现特征以及上下文语义特征抽取关键词,综合考虑文档内部位置以及上下文语义特征对关键词的权重影响,达到了更高的正确率和召回率,提高了3GPP技术标准检索质量,降低了人工成本,可以很好地满足实际应用的需要。
-
公开(公告)号:CN108845989A
公开(公告)日:2018-11-20
申请号:CN201810611478.6
申请日:2018-06-13
Applicant: 北京信息科技大学
Abstract: 本发明涉及一种基于浅层句法分析的情感评价单元抽取方法,包括:步骤1)采用基于CRF的浅层句法分析对用户评论进行处理,识别出产品特征和评价词;步骤2)对用户评论中的产品特征和评价词进行组合,从而获得最终的情感评价单元。本发明提供的基于浅层句法分析的情感评价单元抽取方法,采用浅层句法分析的方法,充分考虑了名词以及名词块都有可能是产品特征的情况,建立了产品特征映射表,统一了某些公共特征的表述,并且在分词和词性标注的时候加入一些新词、网络用语到分词系统中,抽取效果好,抽取结果的正确率和召回率高,可以很好地满足实际应用的需要。
-
公开(公告)号:CN105446956B
公开(公告)日:2018-08-28
申请号:CN201510863734.7
申请日:2015-12-02
IPC: G06F17/27
Abstract: 本发明涉及一种汉语概念复合块标注库规范化处理方法,包括:自动调整错误词类标记;自动补充事件句式内部特征标记;时间块和空间块标记一致化处理。本发明提供的汉语概念复合块标注库规范化处理方法,能够针对TCT语料库在机器自动标注和人工标注的基础上对概念复合块的标注进行全自动的规范化处理,解决了概念复合块标注不一致,不准确的问题,最终提高了标注的准确率,获得了很好的效果,进一步提高语料库的准确性,可以很好地满足实际应用的需要。
-
公开(公告)号:CN107807970A
公开(公告)日:2018-03-16
申请号:CN201710969646.4
申请日:2017-10-18
CPC classification number: G06F16/583 , G06K9/6215
Abstract: 本发明涉及一种基于加权匹配点的三维模型检索方法,包括以下步骤:步骤1)建立加权匹配点的检索模型;步骤2)以模型库中两类三维模型来确定参数;步骤3)求解多目标最优化问题。本发明提供的基于加权匹配点的三维模型检索方法,针对目标模型建立SIFT特征的平衡二叉树,提出加权匹配点的检索模型进行相似性度量来提高检索性能,采用局部特征描述符检索三维模型,检索效率高,检索效果好,可以很好地满足实际应用的需要。
-
公开(公告)号:CN107665356A
公开(公告)日:2018-02-06
申请号:CN201710969648.3
申请日:2017-10-18
Abstract: 本发明涉及一种图像标注方法,包括以下步骤:步骤1)定义图像标注模型的目标函数;步骤2)将图像输入CNN模型,得到原始图像特征;步骤3)对原始图像特征进行加权;步骤4)向LSTM模型中输入信息;步骤5)对预测结果产生的误差进行反向传播。本发明提供的图像标注方法,首先通过卷积神经网络提取图像底层特征,然后使用聚焦机制提取图像特定位置区域与图像标注词相关的图像特征输入到长短期记忆网络模型中,生成相应的预测标注词,最终实现图像标注,标注性能优异,标注精度高,可以很好地满足实际应用的需要。
-
-
-
-
-
-
-
-
-