-
公开(公告)号:CN102902614A
公开(公告)日:2013-01-30
申请号:CN201210334271.1
申请日:2012-09-11
Applicant: 哈尔滨工程大学
IPC: G06F11/32
Abstract: 本发明主要涉及一种实现业务运行状态监测及异常监测结果的引导处理方法。本发明包括:制定监测事件的事件-条件-动作主动规则;构建事件的维度知识库、政策知识库和专家意见知识库;事件监控线程捕获事件信号,对信号进行预处理;指标执行线程监测指标的执行,按优先级运行监测指标;对运行结果进行合规性判断,若符合主动规则,监测结束;若不符合主动规则,对存在疑点的结果发出预警信号;智能引导线程接收处理预警信号,显示预警结果横向维度和纵向维度,调出政策知识库的政策解释和专家意见知识库的专家处理意见。本发明的有益效果在于,只要系统启动,工作流程全部由系统自动完成,不需人工干预,用户只浏览结果即可。
-
公开(公告)号:CN111046665B
公开(公告)日:2023-10-13
申请号:CN201911222879.3
申请日:2019-12-03
Applicant: 哈尔滨工程大学
IPC: G06F40/289 , G06F40/30
Abstract: 本发明属于文本语义提取技术领域,具体涉及一种领域术语语义漂移抽取方法。只要该专业领域的术语语义具有鲜明的时间地域特性(比如社会保险领域中的法律法规和政策等),都可以利用本方法来抽取四元组(领域术语,时间,地域,语义),并以此来刻画领域术语的语义漂移。
-
公开(公告)号:CN111078875B
公开(公告)日:2022-12-13
申请号:CN201911222877.4
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于机器学习的从半结构化文档中提取问答对的方法。本发明应用机器学习的方法,通过应用Apriori进行特征选择和朴素贝叶斯分类方法进行分类,得到半结构化文本中的答案句。本发明结合命名实体识别和依存句法分析理论,将答案句转为对应的问句。命名实体识别采用crf+BiLstm神经网络模型,识别答案句中的实体,补充到网络爬取的实体中。句法分析通过揭示句子中各个词之间的依存关系,从而在问句生成时替换依存于实体的词,得到合理的问句。本发明通过从半结构化文档中提取高质量的问答对,为以后构建问答系统奠定了良好的基础。
-
公开(公告)号:CN111046179B
公开(公告)日:2022-07-15
申请号:CN201911222868.5
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于文本分类处理技术领域,具体涉及一种面向特定领域开放网络问句的文本分类方法。本发明克服了在执行一些特定领域的网络开放文本分类任务的情况下,缺乏足够可用的带类别标记的语料集,且网络文本信息量低、噪音大的问题,并为该领域的开放网络问句的层次分类提供了新方法。本发明利用了特定领域的开放网络问句及书面文本使领域的词嵌入表示更符合领域知识特征,同时,使用半监督方法加速分类模型训练并减少所需的标记样本。此外,还结合了条件概率实现了在多粒度层级的类别划分。本发明可以在问答系统、情感分析、领域知识库等领域辅助数据的提取、判别和构建。
-
公开(公告)号:CN112836507A
公开(公告)日:2021-05-25
申请号:CN202110039892.6
申请日:2021-01-13
Applicant: 哈尔滨工程大学
IPC: G06F40/289 , G06F16/36 , G06F16/35
Abstract: 本发明属于文本主题抽取技术领域,具体涉及一种领域文本主题抽取方法。本发明应用了统计学习方法中的LDA主题模型,并在LDA主题模型三层贝叶斯网络基础上提出增加审计方法层,形成四层贝叶斯网络。该模型认为文本由审计方法的多项分布构成,审计方法由主题的多项分布构成。首先分别生成审计方法、文本主题和词语的多项分布,然后由狄利克雷分布为主题的多项分布,审计方法的多项分布和词语的多项分布分配参数,利用吉布斯抽样计算得到真实的包含审计方法的主题分布参数。该方法相较于LDA主题模型,在提取出的主题中加入了审计方法的信息,降低了主题间重叠度过高的问题,同时也可以为四险一金领域知识图谱的审计工具集提供支持。
-
公开(公告)号:CN111078875A
公开(公告)日:2020-04-28
申请号:CN201911222877.4
申请日:2019-12-03
Applicant: 哈尔滨工程大学
Abstract: 本发明属于自然语言处理技术领域,具体涉及一种基于机器学习的从半结构化文档中提取问答对的方法。本发明应用机器学习的方法,通过应用Apriori进行特征选择和朴素贝叶斯分类方法进行分类,得到半结构化文本中的答案句。本发明结合命名实体识别和依存句法分析理论,将答案句转为对应的问句。命名实体识别采用crf+BiLstm神经网络模型,识别答案句中的实体,补充到网络爬取的实体中。句法分析通过揭示句子中各个词之间的依存关系,从而在问句生成时替换依存于实体的词,得到合理的问句。本发明通过从半结构化文档中提取高质量的问答对,为以后构建问答系统奠定了良好的基础。
-
公开(公告)号:CN102402615A
公开(公告)日:2012-04-04
申请号:CN201110434707.X
申请日:2011-12-22
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供了一种基于结构化查询语言语句的源信息追踪方法。首先将SQL语句按其不同的结构进行分类,之后对不同类型的SQL语句进行逆向处理,在得到源信息后将源信息进行存储,并在源信息上再次执行原SQL语句,与之前得到的结果集进行对比,得出结论。该源信息查询方法已经通过实际数据进行了验证,验证结果证明该方法与其他数据血缘方法相比,可以在原有SQL的基础上,直接对SQL语句进行处理,将其有效的转化成源信息查询语句,并成功查找到对应的源信息。本发明提供的数据追踪方法适用于关系数据库中源信息的查询,可应用在各领域中对源信息进行的查询和存储。
-
-
-
-
-
-