-
公开(公告)号:CN110110088A
公开(公告)日:2019-08-09
申请号:CN201910412742.8
申请日:2019-05-17
Applicant: 苏州大学
IPC: G06F16/35
Abstract: 本申请公开了一种文本分类的方法,包括:接收输入的分类语料;利用分类语料构建多组句对语料;利用分类语料训练预设神经网络,得到文本分类模型;基于文本分类模型的特征抽取网络构建双输入二分类模型,并利用句对语料对双输入二分类模型进行训练;当双输入二分类模型训练完成后,利用双输入二分类模型对文本分类模型的特征抽取网络进行优化,并利用优化后的文本分类模型对待分类文本进行文本分类。本申请令文本分类模型能更可靠地抽取文本的深层语义特征,进一步提升了文本分类性能,解决了现有技术中基于神经网络的分类难以进一步优化特征抽取网络的问题。本申请同时还提供了一种文本分类的系统、设备及计算机可读存储介质,具有上述有益效果。
-
公开(公告)号:CN109299442A
公开(公告)日:2019-02-01
申请号:CN201811168250.0
申请日:2018-10-08
Applicant: 苏州大学
Abstract: 本发明涉及一种汉语篇章主次关系识别方法,包括:读取标注文档集合中的篇章单元标注信息和篇章主次关系类型标注信息,得到篇章主次关系集合,对篇章主次关系集合中的非二元化篇章主次关系进行左子树转化,得到二元篇章主次关系集合。所述标注文档集合是已经标注了篇章主次关系类型的文档集合,是本发明训练模型的基础。基于门控记忆网络的篇章主次关系识别系统和方法,将预测的篇章单元转化成词向量,利用门控记忆神经网络自动的捕获篇章单元之间的隐含特征,以及相对于整体来说更重要的信息;本发明的方法和系统,与现有方法和系统相比,汉语篇章主次关系识别性能得到了提升。
-
公开(公告)号:CN106055536B
公开(公告)日:2018-08-21
申请号:CN201610333246.X
申请日:2016-05-19
Applicant: 苏州大学
Abstract: 本发明提出篇章级别的中文事件联合推理方法和系统,该方法和系统能利用论元抽取中有价值的信息来反过来帮助触发词抽取,减少传统管道模型中的级联错误。在实现方法上,本发明采用机器学习和推理相结合的方法,利用各种语言知识来识别中文事件时序关系。本发明的方法和系统,与现有方法和系统相比,识别性能得到了一定提升。
-
公开(公告)号:CN105302794B
公开(公告)日:2018-08-07
申请号:CN201510726584.5
申请日:2015-10-30
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 种中文同指事件识别方法及系统,所述方法包括:对同指标注文本和测试文本中每个包含事件的句子进行词语切分、实体识别和句法分析,得到预处理标注文本集合和预处理测试文本集合,并分别从预处理标注文本集合和预处理测试文本集合中以文档为单位抽取事件类型相同的事件对及其特征信息,得到标注文本特征集合和测试文本特征集合。根据标注文本特征集合中各个事件对的特征,训练个同指事件识别模型;再利用同指事件识别模型判别测试文本特征集合中每个特征对应的事件对是否存在同指关系,得到事件同指第集合。对事件同指第集合中初步识别的同指事件结果以文档为单位进行全局优化,得到事件同指集合。如此,提高了同指事件识别的性能。
-
公开(公告)号:CN106951530A
公开(公告)日:2017-07-14
申请号:CN201710169761.3
申请日:2017-03-21
Applicant: 苏州大学
Abstract: 本申请提供了一种事件类型抽取方法和装置,该方法包括:从预置的语料库中提取出候选语料词语;基于所述语料库,确定预置的触发词集合中的基准触发词与所述候选语料词语的关联性,其中,所述基准触发词为通过自动内容抽取技术确定的;对于任意一个基准触发词,将与所述基准触发词关联性满足预设要求的候选语料词语确定为目标触发词,得到至少一个所述目标触发词;确定所述触发词集合中的所述目标触发词的特征;基于目标触发词的特征,对目标触发词进行聚类,得到聚类出的属于不同事件类别的聚类集合。该方法和装置为提高事件抽取的准确性以及增大事件抽取的应用范围提供了可能。
-
-
公开(公告)号:CN103617280B
公开(公告)日:2017-01-25
申请号:CN201310664718.6
申请日:2013-12-09
Applicant: 苏州大学
IPC: G06F17/30
Abstract: 本发明公开一种中文事件信息挖掘方法和系统,该方法基于挖掘需求,定义事件样本模型,实例化事件样本模型,得到种子事件,该种子事件作为从原始文本中挖掘事件的依据。对原始文本进行预处理,得到候选模板集合;并对种子事件进行信息标注,基于标注信息对种子事件进行处理,得到种子模板集合。之后采用迭代方法,依据候选模板评级得分和候选模板与种子模板间的语义相似度对候选模板集合进行处理,得到挖掘事件锚集合,并依据该集合中每个挖掘事件锚和种子事件集合中任一种子事件锚的词汇语义相似度,获取挖掘事件锚对应的事件类型。可见本发明只需标注少量样本,即只需标注种子事件即可实现从原始文本中挖掘中文事件信息的目的,降低了挖掘成本。
-
公开(公告)号:CN103530281B
公开(公告)日:2016-06-22
申请号:CN201310482550.7
申请日:2013-10-15
Applicant: 苏州大学
IPC: G06F17/27
Abstract: 本发明公开一种论元抽取方法和系统,所述方法基于标注信息对训练语料中标注事件实例进行处理,得到训练语料论元模式集合;基于测试语料中事件实例的角色集合对事件实例进行处理,得到测试语料候选论元模式集合;根据论元、触发词语义相似性及依存路径相似性,计算每一候选论元模式和训练语料论元模式集合中各论元模式的模式语义相似度,并基于此获取包含候选论元匹配事件实例中可匹配角色的匹配度信息的论元模式相似度集合;基于论元模式相似度集合,选取与事件实例中的角色匹配度最高且匹配度大于预设阈值的候选论元作为角色的论元。可见本发明基于语义特征对中文事件的论元进行提取,提高了中文事件论元提取的准确率和性能。
-
公开(公告)号:CN104392339A
公开(公告)日:2015-03-04
申请号:CN201410620785.2
申请日:2014-11-06
Applicant: 苏州大学
Abstract: 本发明公开了一种于押运物流的组合交接认证方法及其系统,其特征在于:(a)预存交接任务信息至远程服务器中;(b)手持终端经无线网络发送交接请求,检测信号发送的地理位置,确认符合后回传开启密码;(c)手持终端开启认证界面显示,读取若干个认证标签信息,通过无线网络与远程服务器联接,比较获取的认证标签信息是否正确,同时下载人员信息,进入人工认证阶段;(d)进行实物交接,上传交接物品的标签信息,结束交接。本发明通过无线网络与远程服务器保持实时通讯,设定电子围栏,在线上传下截信息,保证交接过程的可控性、及时性及可靠性,避免交接错误、遗漏等情况,具有交接过程可溯源性,使整个交接过程更为安全,可靠。
-
公开(公告)号:CN104123841A
公开(公告)日:2014-10-29
申请号:CN201410399025.3
申请日:2014-08-14
Applicant: 苏州大学
IPC: G08G1/01
Abstract: 本发明公开了一种车辆到站时间的获取方法及系统,从日期、时段及路段三维信息入手,根据车辆到站时间波动性,将待预测的目标路段分成不同的路段,对每个路段进行车辆到站时间的分段预测,最终获取到待预测的目标线路在目标路段上车辆到达路段终点的时间,在达到本发明目的的同时,相对于现有的时间获取方案,基于车辆到站时间的波动性进行到站时间获取,明显提高时间获取的准确性,而且,本发明利用向量机对象对作为训练记录的路线记录生成每个路段的预测运行时间,进而得到车辆到站时间,简化方案的复杂度,降低方案运行时间,提高车辆到站时间的获取效率。
-
-
-
-
-
-
-
-
-