-
公开(公告)号:CN108763206B
公开(公告)日:2022-04-05
申请号:CN201810491735.7
申请日:2018-05-22
Applicant: 南京邮电大学
IPC: G06F40/284 , G06F16/332 , G06F16/33 , G06F16/338
Abstract: 本发明公开了一种对单文本关键字进行快速排序的方法,其特征在于,所述方法包括下列步骤:S1:选定单文本并将单文本转换成对应的图模型结构,然后根据图模型结构生成候选词邻接矩阵;S2:采用幂法迭代生成候选词邻接矩阵的值为1的特征值对应的特征向量的近似值;S3:在步骤S2中采用定性分析,对每次幂法迭代生成的特征向量进行定性分析,生成局部排序向量;S4:设定一个判断阈值,计算相邻两次迭代生成的排序向量之间的逆序数值,比较逆序数值与上一轮迭代对应的逆序数值的大小,同时比较上一轮迭代的逆序数值与判断阈值的大小;本发明的方法可以使迭代过程迅速收敛,能够有效降低计算的时间复杂度,同时具有提取精度高,排序正确性高的特点。
-
公开(公告)号:CN108763206A
公开(公告)日:2018-11-06
申请号:CN201810491735.7
申请日:2018-05-22
Applicant: 南京邮电大学
CPC classification number: G06F17/277
Abstract: 本发明公开了一种对单文本关键字进行快速排序的方法,其特征在于,所述方法包括下列步骤:S1:选定单文本并将单文本转换成对应的图模型结构,然后根据图模型结构生成候选词邻接矩阵;S2:采用幂法迭代生成候选词邻接矩阵的值为1的特征值对应的特征向量的近似值;S3:在步骤S2中采用定性分析,对每次幂法迭代生成的特征向量进行定性分析,生成局部排序向量;S4:设定一个判断阈值,计算相邻两次迭代生成的排序向量之间的逆序数值,比较逆序数值与上一轮迭代对应的逆序数值的大小,同时比较上一轮迭代的逆序数值与判断阈值的大小;本发明的方法可以使迭代过程迅速收敛,能够有效降低计算的时间复杂度,同时具有提取精度高,排序正确性高的特点。
-
公开(公告)号:CN112464651A
公开(公告)日:2021-03-09
申请号:CN202011297709.4
申请日:2020-11-18
Applicant: 南京邮电大学
IPC: G06F40/242 , G06F40/284 , G06F40/58 , G06N3/08
Abstract: 本发明公开了一种针对词汇序列数据的综合位置编码方法,在词汇序列输入模型之前,每个词汇除了自身的编码之外,还附加了词汇在序列中绝对位置的编码;在深度学习模型中进行两两词汇的二元关系计算时,还加入了两个词汇在序列中的相对位置的编码;两种位置编码本身的数值是可优化的,在训练过程中不断被调整数值。本发明在对词汇原位置进行绝对位置编码的基础上,进一步将任意两个词汇之间距离进行编码,并将两种编码进行组合,从而将具有序列化特征的语言源数据在并行输入到深度学习模型进行计算时,能够有效地体现数据的序列性。相比现有的位置编码方法,本发明可以使目前主流的机器翻译模型实现更高的翻译精度,错误率更低。
-
公开(公告)号:CN112464651B
公开(公告)日:2023-06-23
申请号:CN202011297709.4
申请日:2020-11-18
Applicant: 南京邮电大学
IPC: G06F40/242 , G06F40/284 , G06F40/58 , G06N3/0455 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种针对词汇序列数据的综合位置编码方法,在词汇序列输入模型之前,每个词汇除了自身的编码之外,还附加了词汇在序列中绝对位置的编码;在深度学习模型中进行两两词汇的二元关系计算时,还加入了两个词汇在序列中的相对位置的编码;两种位置编码本身的数值是可优化的,在训练过程中不断被调整数值。本发明在对词汇原位置进行绝对位置编码的基础上,进一步将任意两个词汇之间距离进行编码,并将两种编码进行组合,从而将具有序列化特征的语言源数据在并行输入到深度学习模型进行计算时,能够有效地体现数据的序列性。相比现有的位置编码方法,本发明可以使目前主流的机器翻译模型实现更高的翻译精度,错误率更低。
-
公开(公告)号:CN110399619B
公开(公告)日:2023-04-28
申请号:CN201910693637.6
申请日:2019-07-30
Applicant: 南京邮电大学
IPC: G06F40/58 , G06F40/42 , G06N3/044 , G06N3/0455 , G06N3/0464 , G06N3/048 , G06N3/084
Abstract: 本发明公开了一种面向神经机器翻译的位置编码方法和计算机存储介质,方法包括以下步骤:1)将训练语料中的非重复词汇构成词典形成词汇空间矩阵,计算位置缩放系数向量矩阵和位置偏移量向量矩阵;2)生成词汇嵌入向量;3)从训练语料中抽取源语句向量矩阵,将其中包含的词汇嵌入向量与位置缩放系数向量矩阵逐元素相乘,再与位置偏移量向量矩阵逐元素相加;4)将结果输入到深度学习模型中进行正向传播,并计算得出模型损失;5)将模型损失通过反向传播更新参数;6)重复步骤2)至步骤5)直至所述深度学习模型收敛。本发明可以在不增加额外的模型训练时间的前提下,使目前主流的机器翻译模型实现更高的翻译精度。
-
公开(公告)号:CN110399619A
公开(公告)日:2019-11-01
申请号:CN201910693637.6
申请日:2019-07-30
Applicant: 南京邮电大学
Abstract: 本发明公开了一种面向神经机器翻译的位置编码方法和计算机存储介质,方法包括以下步骤:1)将训练语料中的非重复词汇构成词典形成词汇空间矩阵,计算位置缩放系数向量矩阵和位置偏移量向量矩阵;2)生成词汇嵌入向量;3)从训练语料中抽取源语句向量矩阵,将其中包含的词汇嵌入向量与位置缩放系数向量矩阵逐元素相乘,再与位置偏移量向量矩阵逐元素相加;4)将结果输入到深度学习模型中进行正向传播,并计算得出模型损失;5)将模型损失通过反向传播更新参数;6)重复步骤2)至步骤5)直至所述深度学习模型收敛。本发明可以在不增加额外的模型训练时间的前提下,使目前主流的机器翻译模型实现更高的翻译精度。
-
公开(公告)号:CN110197152B
公开(公告)日:2022-08-26
申请号:CN201910454059.0
申请日:2019-05-28
Applicant: 南京邮电大学
IPC: G06V20/58 , G06V10/80 , G06V10/774 , G06K9/62
Abstract: 本发明公开了一种用于自动驾驶系统的道路目标识别方法,包括如下步骤:调整输入图片大小;通过主干网络提取图片特征;通过扩张卷积模块进行下采样;基于部分特征图构建特征金字塔结构;在特征金字塔结构和下采样所得的尺度不同的特征图上生成锚框;将图片通过网络得到边界框相对于锚框的偏移值,对其进行解码得到边界框;对这些边界框进行降序排列和非极大值抑制得到最终检测识别结果;在训练部分,利用平滑化的绝对值损失函数和平衡前背景样本类别的加权平均损失函数对该网络进行训练。本发明显著增大了网络浅层的感受野,满足了识别小目标时对空间分辨率的需求;本发明充分利用全部的前背景样本来训练网络,具有很好的普适性和广泛的应用前景。
-
公开(公告)号:CN110197152A
公开(公告)日:2019-09-03
申请号:CN201910454059.0
申请日:2019-05-28
Applicant: 南京邮电大学
Abstract: 本发明公开了一种用于自动驾驶系统的道路目标识别方法,包括如下步骤:调整输入图片大小;通过主干网络提取图片特征;通过扩张卷积模块进行下采样;基于部分特征图构建特征金字塔结构;在特征金字塔结构和下采样所得的尺度不同的特征图上生成锚框;将图片通过网络得到边界框相对于锚框的偏移值,对其进行解码得到边界框;对这些边界框进行降序排列和非极大值抑制得到最终检测识别结果;在训练部分,利用平滑化的绝对值损失函数和平衡前背景样本类别的加权平均损失函数对该网络进行训练。本发明显著增大了网络浅层的感受野,满足了识别小目标时对空间分辨率的需求;本发明充分利用全部的前背景样本来训练网络,具有很好的普适性和广泛的应用前景。
-
-
-
-
-
-
-