-
公开(公告)号:CN116595169A
公开(公告)日:2023-08-15
申请号:CN202310415758.0
申请日:2023-04-18
Applicant: 北京信息科技大学 , 华能煤炭技术研究有限公司
IPC: G06F16/35 , G06F16/332 , G06F40/186 , G06N3/08 , G06N3/047
Abstract: 本专利摘要涉及一种基于提示学习的煤矿生产领域问答意图分类方法。问答系统是智能化信息处理的重要领域,也是煤矿智能化建设不可或缺的一部分。在实际应用中,意图分类是智能问答的重要子任务,它可以帮助问答系统更好地理解用户查询意图并提供准确答案。本方法通过引入不同的提示模板对BERT预训练模型进行微调,从而提高问答意图分类的准确性。实验结果表明,引入提示模板后,模型的准确率、召回率和F1值均有所提高。此外,该方法还可以在少样本场景下快速适配新领域的任务,具有较好的应用价值。因此,本专利摘要所述的基于提示学习的煤矿生产领域问答意图分类方法可用于问答系统的开发和应用。
-
公开(公告)号:CN115858813A
公开(公告)日:2023-03-28
申请号:CN202211628660.5
申请日:2022-12-20
Applicant: 北京信息科技大学 , 北京市工程咨询有限公司
IPC: G06F16/36 , G06F18/22 , G06F18/214 , G06F16/35 , G06F16/332 , G06F40/30
Abstract: 本发明涉及面向工程咨询报告的文本检索方法,以改善工程咨询报告撰写过程中人力成本大、编撰周期过长等问题,包括以下步骤:构建面向工程咨询报告的文本检索语料集,使用语料集微调simCSE对比学习模型,将得到的模型参数初始化Vanilla BERT模型,将语料的文本信息送入Vanilla BERT模型得到语义匹配分数。将文本信息和关键词信息通过SAT模型得到词级粒度的义原词向量表示并送入DRMM深度文本交互模型,得到关联匹配分数。将得到的语义匹配分数和关联匹配分数归一化后加权融合,得到最终的匹配分数,完成标题与段落之间的文本检索。本发明联合上下文向量表示和文本交互匹配方法,有效增强了文本检索的效果。
-
公开(公告)号:CN115357187A
公开(公告)日:2022-11-18
申请号:CN202210950209.9
申请日:2022-08-15
Applicant: 北京信息科技大学
Abstract: 本发明涉及存储系统领域中的绿色存储技术以及自然语言处理领域中的数据语义挖掘技术,针对存储系统中数据语义的挖掘,采用多特征融合方法,提升了现有基于单一特征在数据布局策略上的不足,包括以下步骤:(一)、设定实验所需200个访问关键词;(二)、将中国34个省级行政区,按标准划分为四季分明区、夏长冬短区、冬长夏短区和其他区;(三)、获取每个气候区中200个关键词3年每日的访问记录;(四)、利用K‑means聚类,确定关键词在不同气候区的季节属性;(五)、构建存储系统能耗和成本模型,得到不同粒度框架下的能耗和成本。本发明融合“季节+地域”特征,充分提取关键词的季节属性,能够更为有效地降低存储能耗和成本。
-
公开(公告)号:CN115204519A
公开(公告)日:2022-10-18
申请号:CN202210972465.8
申请日:2022-08-17
Applicant: 北京信息科技大学
Abstract: 本发明涉及自然语言处理领域的专利质量等级预测研究,其主要步骤如下:1.利用融合多特征的功效词抽取模型对功效短语进行识别;2.基于Albert‑BiLSTM模型对专利文本中包含的主题词进行抽取;3.将抽取完成的功效短语与主题词用K‑means算法进行聚类,人工构建技术功效矩阵,得到相应的技术功效与技术规模;4.将专利中包含的结构化数字信息单独量化或组合,结合长文本得到132个评价指标,并利用美国专利数据训练一个迁移学习模型,同时利用主动学习技术进行中文数据集的扩充;5.将技术功效矩阵与132个指标相结合进行迁移训练并更新参数,得到最终的预测模型。本发明有效提升了专利质量评估的准确性。
-
-
-