-
公开(公告)号:CN113312532A
公开(公告)日:2021-08-27
申请号:CN202110608376.0
申请日:2021-06-01
Applicant: 哈尔滨工业大学
IPC: G06F16/951 , G06F16/33 , G06F16/35 , G06F40/289 , G06F40/30 , G06K9/62 , G06N3/04 , G06N3/08
Abstract: 本发明公开一种基于深度学习面向公检法领域的舆情等级预测方法。步骤1:从网络上爬取公检法领域相关的舆情信息,提取其中的文本信息存储至数据库中;步骤2:对采集到文本信息利用深度学习模型进行预测,得到舆情等级预测结果;步骤3:将步骤2的舆情等级预测结果存储至系统数据库;步骤4:在数据库中对舆情等级做出相应标识;步骤5:对标识后的数据库中舆情等级提供可访问舆情信息的数据接口;步骤6:通过数据接口在系统中显示舆情等级预测结果。本发明用以解决舆情系统没有针对性的问题,跳出算法的限制。
-
公开(公告)号:CN106844348B
公开(公告)日:2020-01-17
申请号:CN201710077125.8
申请日:2017-02-13
Applicant: 哈尔滨工业大学
IPC: G06F40/205 , G06F40/16
Abstract: 一种汉语句子功能成分分析方法,本发明涉及汉语句子功能成分分析方法。本发明的目的是为了解决现有技术没有考虑汉语句子的功能成分的问题。过程为:一、对训练语料进行处理,对CTB5.0进行转化,转化成带有功能成分标签的形式,进行修正得到修正后的语料;转化成基于字粒度的形式,作为A;二、将A输入句法功能成分分析器进行训练得到汉语句子功能成分分析模型C;三、对纯汉语文本数据进行处理,得到带有功能成分标签的句子,转化成基于字粒度的形式,作为B,将A与B相结合作为最终的训练数据;四、采用汉语句子功能成分分析模型D对待测试汉语句子进行测试,得到测试结果。本发明用于句子功能成分分析领域。
-
公开(公告)号:CN109063035A
公开(公告)日:2018-12-21
申请号:CN201810779805.9
申请日:2018-07-16
Applicant: 哈尔滨工业大学
CPC classification number: G06F17/271 , G06F17/2775 , G06F17/278 , G06K9/6256 , G06K9/6273
Abstract: 一种面向出行领域的人机多轮对话方法,它用于信息技术领域。本发明解决了目前的多轮对话系统对用户问句的意图信息和槽位信息提取存在困难的问题。本发明对短文本问句进行规范化处理,并利用DAN、CNN或BLSTM模型提取规范化处理后的短文本问句的意图信息,且基于BLSTM的模型取得了Micro‑F1值为93.47%的理想效果;利用引入意图特征词的BLSTM‑CRF模型提取规范化处理后的短文本问句的槽位信息,且模型取得了F1值为89.47%的理想效果;将历史的槽位信息和当前问句的槽位信息作为输入,确定当前的对话状态信息,并结合当前问句的意图信息确定下一步的回复策略;根据确定的回复策略选择对应的模板回复给用户。本发明可以应用于信息技术领域用。
-
公开(公告)号:CN106844348A
公开(公告)日:2017-06-13
申请号:CN201710077125.8
申请日:2017-02-13
Applicant: 哈尔滨工业大学
Abstract: 一种汉语句子功能成分分析方法,本发明涉及汉语句子功能成分分析方法。本发明的目的是为了解决现有技术没有考虑汉语句子的功能成分的问题。过程为:一、对训练语料进行处理,对CTB5.0进行转化,转化成带有功能成分标签的形式,进行修正得到修正后的语料;转化成基于字粒度的形式,作为A;二、将A输入句法功能成分分析器进行训练得到汉语句子功能成分分析模型C;三、对纯汉语文本数据进行处理,得到带有功能成分标签的句子,转化成基于字粒度的形式,作为B,将A与B相结合作为最终的训练数据;四、采用汉语句子功能成分分析模型D对待测试汉语句子进行测试,得到测试结果。本发明用于句子功能成分分析领域。
-
公开(公告)号:CN103617160B
公开(公告)日:2017-02-08
申请号:CN201310674134.7
申请日:2013-12-11
Applicant: 哈尔滨工业大学
Abstract: 基于两两对齐的多语种句对齐方法及装置,属于信息技术领域,尤其涉及信息技术领域互联网语言翻译系统中的多语种句对齐方法。本发明是为了解决在利用两两对齐方法进行多语种句对齐时,对齐结果不一致的问题。本发明所述的基于两两对齐的多语种句对齐方法及装置,首先对不同语种文本中的句子进行两两对齐,获得两两对齐结果,然后对该结果进行冲突识别并将冲突的部分标记出来,最后对冲突部分进行评分并重新进行两两对齐,从而使得多语种句对齐结果具有一致性,从而可以将两两对齐结果中部分对齐错误的错误结果更正过来。本发明所述的基于两两对齐的多语种句对齐方法及装置,适用于信息技术领域互联网语言翻译系统中。
-
公开(公告)号:CN105678409A
公开(公告)日:2016-06-15
申请号:CN201511029681.5
申请日:2015-12-31
IPC: G06Q10/04
CPC classification number: G06Q10/04
Abstract: 一种自适应且分布无关的时间序列异常点检测方法,涉及信息技术领域,尤其涉及一种自适应且分布无关的时间序列异常点检测方法。本发明为了解决现有时间序列数据中存在未知分布、界限控制难、参数需求多、训练数据少以及‘异常’本身的模糊性的问题。本发明按以下步骤进行:一、异常点的定义;二、时间序列特征化;三、相似度和异常度确定;四、基于统计假设检验的检测;五、增强式模糊化过程。本发明解决了现有技术中时间序列数据存在的一系列技术问题,并取得良好技术效果。本发明可应用于信息技术领域。
-
公开(公告)号:CN103092831B
公开(公告)日:2015-08-19
申请号:CN201310029538.0
申请日:2013-01-25
Applicant: 哈尔滨工业大学
IPC: G06F17/28
CPC classification number: G06F17/2818 , G06F17/2827 , G06F17/2836 , G06F17/289
Abstract: 一种用于统计机器翻译的参数调整方法,涉及一种参数调整方法。是要解决现有方法在参数调整过程中容易造成参数的过拟合现象及陷入局部最优解的问题。方法:步骤一:利用单语语料库构建翻译所需的语言模型;步骤二:利用双语平行语料库构建翻译模型;步骤三:利用目标函数对参数进行调整。本发明的方法易于实现,能够防止在参数调整过程中出现过拟合现象,并能结合较多的特征数目。另外,由于目标函数是凸的,因此在训练过程中亦能够得到全局的最优解。本发明方法用于翻译系统的参数调整。
-
公开(公告)号:CN103605644A
公开(公告)日:2014-02-26
申请号:CN201310636884.5
申请日:2013-12-02
Applicant: 哈尔滨工业大学
IPC: G06F17/28
Abstract: 一种基于相似度匹配的枢轴语言翻译方法和装置,本发明属于机器翻译技术领域,涉及一种基于相似度匹配的枢轴语言翻译方法和装置。解决现有翻译方法和装置在源语言-目标语翻译规则库构建中要求源语言到枢轴语的翻译规则与该枢轴语到目标语的翻译规则,中的枢轴语短语必须完全相同而导致的潜在翻译规则丢失问题。通过用向量表示枢轴语短语并利用向量夹角余弦值对枢轴语进行匹配关联,建立源语言-目标语翻译规则库,通过源语言-目标语翻译规则库进行自然语言翻译。并根据上述步骤功能模块化制成基于相似度匹配的枢轴语言翻译装置。本发明用于自然语言翻译。
-
公开(公告)号:CN103092831A
公开(公告)日:2013-05-08
申请号:CN201310029538.0
申请日:2013-01-25
Applicant: 哈尔滨工业大学
IPC: G06F17/28
CPC classification number: G06F17/2818 , G06F17/2827 , G06F17/2836 , G06F17/289
Abstract: 一种用于统计机器翻译的参数调整方法,涉及一种参数调整方法。是要解决现有方法在参数调整过程中容易造成参数的过拟合现象及陷入局部最优解的问题。方法:步骤一:利用单语语料库构建翻译所需的语言模型;步骤二:利用双语平行语料库构建翻译模型;步骤三:利用目标函数对参数进行调整。本发明的方法易于实现,能够防止在参数调整过程中出现过拟合现象,并能结合较多的特征数目。另外,由于目标函数是凸的,因此在训练过程中亦能够得到全局的最优解。本发明方法用于翻译系统的参数调整。
-
公开(公告)号:CN114818658B
公开(公告)日:2025-05-06
申请号:CN202210617790.2
申请日:2022-06-01
Applicant: 哈尔滨工业大学
IPC: G06F40/211 , G06F40/295 , G06N3/042 , G06N3/0455 , G06N3/0442 , G06N3/0464 , G06N5/04
Abstract: 本发明提出一种基于图神经网络和推理路径的文档级关系抽取方法。本发明为了解决在文档级关系抽取中常用的图模型方法只能关注实体局部特征的特点,不能很好的表示两个实体之间全局特征的问题。本发明的具体的步骤为:步骤一、基于启发式的规则将一篇输入的文档转化为图结构;步骤二、利用路径搜索算法在构造图结构中提取出不同实体对之间的多条路径;步骤三、利用神经网络编码器对输入文档编码,并得到图中节点的向量表示,利用图神经网络更新图中节点的向量表示;步骤四、得到图结构中实体对之间的路径信息向量表示;步骤五、对实体对之间的关系进行判断,使用标注好的数据训练深度学习模型。本发明属于自然语言处理领域。
-
-
-
-
-
-
-
-
-