-
公开(公告)号:CN106021227A
公开(公告)日:2016-10-12
申请号:CN201610324281.5
申请日:2016-05-16
Applicant: 南京大学
IPC: G06F17/27
CPC classification number: G06F17/271 , G06F17/2775
Abstract: 本发明提出了一种基于状态转移与神经网络的汉语组块分析方法,包括:将组块分析任务转换成序列化标注任务,使用基于状态转移的框架对句子进行标注,在标注的过程中使用前向神经网络来对每个状态将要进行的转移操作进行打分,并将利用双向长短记忆神经网络模型学习到的词以及词性标注的分布式表示特征作为标注模型的附加信息特征,从而提高组块分析的精确度。对比其它汉语组块分析技术,该汉语组块分析方法使用的基于状态转移的框架可以更灵活地添加组块级别的特征,同时神经网络的使用可以自动学到特征之间的组合方式,双向长短记忆神经网络模型的利用引入了有用的附加信息特征,三者的结合有效提高了组块分析的准确度。
-
公开(公告)号:CN104899193A
公开(公告)日:2015-09-09
申请号:CN201510330285.X
申请日:2015-06-15
Applicant: 南京大学
IPC: G06F17/28
Abstract: 本发明提出了一种计算机中限定翻译片段的交互式翻译方法,包括:用户输入需要翻译的句子,由系统给出原始翻译结果,当用户对系统给出的翻译结果的顺序有不同意见,通过点击操作对源语言片段进行限制,使得其作为一个完整的整体,系统根据重新翻译,避免系统翻译中存在的某些整体被作为多个子部分而分别翻译时,与其他部分发生的调序错误。对比现有的简单的网页翻译系统,本方法突出在不需要用户提供正确翻译结果的情况下,仅提供翻译片段切分信息,即可以让系统利用用户提供的信息进行重新解码,针对调序问题进行限制;对比已有的交互式翻译系统,本方法提供了更有效的交互信息及交互方式,在实际实验情况下可提高翻译质量。
-
公开(公告)号:CN114881031B
公开(公告)日:2025-05-23
申请号:CN202210428560.1
申请日:2022-04-22
Applicant: 南京大学
IPC: G06F40/295 , G06F40/30 , G06F16/28
Abstract: 本发明公开了一种命名实体识别模型的训练方法,利用预训练好的成分句法分析器,构建出输入文本的成分分析树;基于生成规则,通过所述成分分析树形成关键句法成分候选集合;通过掩蔽不同的关键句法成分,筛选出所述关键句法成分候选集合中最重要的两个关键句法成分;分别掩蔽实体和最重要的两个关键句法成分,得到两种词嵌入并引入一种门控机制对两种词嵌入进行融合,形成每个词最终的词嵌入表示;将文本中所述每个词最终的词嵌入表示作为输入,输入条件随机场中进行训练,得到命名实体识别模型。本发明加强了最终词嵌入的表达能力;省去标注样本数据所需的人力成本;有效减轻整个句子复杂语义的影响,简化人类阅读和理解的过程,可解释性较强。
-
公开(公告)号:CN119560066A
公开(公告)日:2025-03-04
申请号:CN202411544227.2
申请日:2024-10-31
IPC: G16C60/00 , G06F16/903 , G06N5/022 , G06N3/08 , G06N3/042
Abstract: 本发明提供一种基于模块化深度学习的材料属性预测方法和装置,应用于云端材料知识共享平台,云端材料知识共享平台加载有材料知识库,材料知识库包括:多组参数模块,一组参数模块对应一个异质材料任务,异质材料任务用于实现材料的属性预测;方法包括:接收用户上传的目标材料的目标属性预测问题;基于目标属性预测问题在材料知识库中查询,确定对应的目标参数模块,并将目标参数模块返回至用户;其中,目标参数模块用于:使用户基于目标参数模块训练模型,并基于训练后的模型进行目标材料的属性预测。通过本发明提供的方法,从材料知识库中选取与给定下游任务最相关的模块,有效适配下游材料属性预测任务。
-
公开(公告)号:CN113095092B
公开(公告)日:2024-05-31
申请号:CN202110416255.6
申请日:2021-04-19
Applicant: 南京大学
IPC: G06F40/58 , G06F40/211 , G06N3/0455 , G06N3/0442 , G06N3/048 , G06N3/0499 , G06N3/08
Abstract: 本发明公开了一种通过建模协同关系提高非自回归神经机器翻译质量的方法,将源端表示结合目标语言序列的长度构造非自回归神经机器翻译模型中解码器的输入,然后结合依存语法树、源端表示、解码器输入得到目标语言序列的协同关系矩阵,最后将目标语言序列的协同关系矩阵集成于非自回归神经机器翻译模型中的解码器。本发明通过依存语法树来建模目标序列中词与词之间的协同关系,在兼顾依赖关系的同时使翻译质量获得了显著的提升。
-
公开(公告)号:CN111984765B
公开(公告)日:2023-10-24
申请号:CN201910422428.8
申请日:2019-05-21
Applicant: 南京大学
IPC: G06F16/332 , G06F16/36 , G06N3/0455 , G06N3/0442 , G06N3/088
Abstract: 本公开涉及一种知识库问答过程关系检测方法及装置,所述方法包括:获取问句表示和对应的待检测关系;确定所述待检测关系在知识库中的初始关系表示;将所述初始关系表示映射至知识库问答空间的已登录关系表示,得到映射后的关系表示;确定所述待检测关系对应的词级别表示;确定所述映射后的关系表示的全局级别表示;确定最终关系表示;根据所述最终关系表示和所述问句表示的相似度,确定所述待检测关系的检测结果。利用本公开各实施例,可以提高关系检测的准确率。
-
公开(公告)号:CN115249317A
公开(公告)日:2022-10-28
申请号:CN202110379492.X
申请日:2021-04-08
Applicant: 南京大学
IPC: G06V10/774 , G06N3/08
Abstract: 本公开涉及一种生成图像描述信息的方法和装置。包括:获取待处理的目标图像;将所述目标图像输入图像描述模型,输出所述目标图像的描述信息,所述图像描述模型被设置为根据样本图像和样本图像的描述信息之间的对应关系训练得到,其中,利用强化学习算法对图像描述模型进行二次训练。本公开利用样本图像和样本图像的描述信息之间的对应关系训练得到图像描述模型,并利用强化学习算法对图像描述模型进行二次训练,能够优化图像描述模型,提高图像描述模型输出的描述信息的准确度和流畅度。
-
公开(公告)号:CN114881031A
公开(公告)日:2022-08-09
申请号:CN202210428560.1
申请日:2022-04-22
Applicant: 南京大学
IPC: G06F40/295 , G06F40/30 , G06F16/28
Abstract: 本发明公开了一种命名实体识别模型的训练方法,利用预训练好的成分句法分析器,构建出输入文本的成分分析树;基于生成规则,通过所述成分分析树形成关键句法成分候选集合;通过掩蔽不同的关键句法成分,筛选出所述关键句法成分候选集合中最重要的两个关键句法成分;分别掩蔽实体和最重要的两个关键句法成分,得到两种词嵌入并引入一种门控机制对两种词嵌入进行融合,形成每个词最终的词嵌入表示;将文本中所述每个词最终的词嵌入表示作为输入,输入条件随机场中进行训练,得到命名实体识别模型。本发明加强了最终词嵌入的表达能力;省去标注样本数据所需的人力成本;有效减轻整个句子复杂语义的影响,简化人类阅读和理解的过程,可解释性较强。
-
公开(公告)号:CN114547300A
公开(公告)日:2022-05-27
申请号:CN202210151431.2
申请日:2022-02-18
Applicant: 南京大学
Abstract: 本发明提供了一种结合远程监督和有监督的关系分类方法,通过有监督数据训练得到教师模型,在使用远程监督数据训练学生模型时对实体进行随机遮掩,同时利用蒸馏技术引入教师模型的监督信号,从而达到降噪的目的。得到学生模型后,在有监督数据上微调学生模型,进一步利用有监督数据增强学生模型。
-
公开(公告)号:CN111984765A
公开(公告)日:2020-11-24
申请号:CN201910422428.8
申请日:2019-05-21
Applicant: 南京大学
IPC: G06F16/332 , G06F16/36 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种知识库问答过程关系检测方法及装置,所述方法包括:获取问句表示和对应的待检测关系;确定所述待检测关系在知识库中的初始关系表示;将所述初始关系表示映射至知识库问答空间的已登录关系表示,得到映射后的关系表示;确定所述待检测关系对应的词级别表示;确定所述映射后的关系表示的全局级别表示;确定最终关系表示;根据所述最终关系表示和所述问句表示的相似度,确定所述待检测关系的检测结果。利用本公开各实施例,可以提高关系检测的准确率。
-
-
-
-
-
-
-
-
-