多语言自动文摘方法
    1.
    发明公开

    公开(公告)号:CN106874362A

    公开(公告)日:2017-06-20

    申请号:CN201611253245.0

    申请日:2016-12-30

    Abstract: 本发明涉及一种多语言自动文摘方法,包括以下步骤:步骤101,获取多个目标语言文档中的多个谓词论元结构;步骤102,对所述多个谓词论元结构中的每一个谓词论元进行重要性打分;步骤103,根据所述每一个谓词论元的重要性得分,生成目标语言摘要。本发明中,实现了获取指定语言的摘要,且在保证该摘要含有更多的重要信息的信息量时,提高可读性。

    一种汉语隐式篇章关系识别方法

    公开(公告)号:CN105955956B

    公开(公告)日:2019-01-22

    申请号:CN201610294189.9

    申请日:2016-05-05

    Abstract: 本发明公开了一种汉语隐式篇章关系识别方法,所述方法包括以下步骤:步骤1,对汉语隐式篇章关系论元对进行自动分词处理,得到自动分词结果;步骤2,在得到的汉语隐式篇章关系论元自动分词结果的基础上,学习汉语隐式篇章关系论元的特征表达;步骤3,基于得到的特征表达,通过基于最大间隔的神经网络模型对论元间的汉语隐式篇章关系进行建模;步骤4,利用得到的神经网络模型对汉语隐式篇章关系进行识别。本发明能够对汉语中的隐式篇章关系进行较准确地识别。经过在汉语篇章树库上的实验验证,相对于已有的英语隐式篇章关系识别方法,本发明方法在汉语隐式篇章关系识别上得到准确率更高的识别结果。

    一种汉语隐式篇章关系识别方法

    公开(公告)号:CN105955956A

    公开(公告)日:2016-09-21

    申请号:CN201610294189.9

    申请日:2016-05-05

    Abstract: 本发明公开了一种汉语隐式篇章关系识别方法,所述方法包括以下步骤:步骤1,对汉语隐式篇章关系论元对进行自动分词处理,得到自动分词结果;步骤2,在得到的汉语隐式篇章关系论元自动分词结果的基础上,学习汉语隐式篇章关系论元的特征表达;步骤3,基于得到的特征表达,通过基于最大间隔的神经网络模型对论元间的汉语隐式篇章关系进行建模;步骤4,利用得到的神经网络模型对汉语隐式篇章关系进行识别。本发明能够对汉语中的隐式篇章关系进行较准确地识别。经过在汉语篇章树库上的实验验证,相对于已有的英语隐式篇章关系识别方法,本发明方法在汉语隐式篇章关系识别上得到准确率更高的识别结果。

    离线强化学习训练方法、动作预测方法、装置及介质

    公开(公告)号:CN118153658B

    公开(公告)日:2025-01-07

    申请号:CN202410219901.3

    申请日:2024-02-28

    Abstract: 本申请公开了一种离线强化学习训练方法、动作预测方法、装置及介质,其中方法包括:获取待训练模型控制的机器人的第一静态数据集;第一静态数据集包括机器人的多条历史运行轨迹;待训练模型的网络包括价值函数网络、扩散模型网络和逆动力学网络;基于第一静态数据集对价值函数网络进行训练;基于训练后的价值函数网络生成历史运行轨迹的各个轨迹片段对应的性能标签;基于各个轨迹片段,以及各个性能标签对扩散模型网络和逆动力学网络进行训练。本申请提供的方法和装置,提高了扩散模型的学习准确度,提高了待训练模型的训练效率和预测准确度。

    融合蕴含知识的自动文摘方法及系统

    公开(公告)号:CN108763211B

    公开(公告)日:2020-07-31

    申请号:CN201810499465.4

    申请日:2018-05-23

    Abstract: 本发明涉及自然语言处理领域,提出一种融合蕴含知识的自动文摘方法,旨在解决在对新闻文本的自动文摘中,因生成摘要包含错误的信息,不能正确反映新闻的主体信息,使得自动文摘的效果差的问题。该方法包括:获取待进行文摘提取的新闻文本;利用预先构建的文摘提取模型提取上述新闻文本的文摘;其中,文摘提取模型是基于编码器‑解码器的端到端模型;文摘提取模型中的编码器是基于预设的语料库,并利用多任务学习算法构建的编码模型,并且/或者文摘提取模型中的解码器是基于所述语料库,并利用增强学习算法构建的解码模型;语料库包括预设的新闻语料和该新闻语料对应的蕴含语料。本发明可以快速、准确的从新闻文本中自动文摘出新闻文本的摘要。

    基于文本-图像匹配的多模态自动文摘方法

    公开(公告)号:CN106997387B

    公开(公告)日:2019-08-09

    申请号:CN201710195587.X

    申请日:2017-03-28

    Abstract: 本发明提供了一种基于文本‑图像匹配的多模态自动文摘方法,包括:对多模态信息中的文本信息中的句子进行重要性打分;对多模态信息中的视频信息通过镜头边界切割,提取视频的关键帧;对多模态信息中的图像信息和/或视频信息通过文本‑图像匹配模型为图像和/或关键帧找到语义对应的文本;以及根据每一个句子的重要性得分、图片和关键帧所占权重、与文本的语义相关度,以及惩罚冗余项,生成文本摘要。通过训练文本‑图像匹配模型,将图像或视频中的信息利用文本‑图像匹配模型找到对应语义的文本,实现了同时处理文本、图像和视频信息进行文本摘要,使得输出的自动文摘相较传统的纯文本自动文摘结果具有更好的全面性和准确度。

    融合蕴含知识的自动文摘方法及系统

    公开(公告)号:CN108763211A

    公开(公告)日:2018-11-06

    申请号:CN201810499465.4

    申请日:2018-05-23

    Abstract: 本发明涉及自然语言处理领域,提出一种融合蕴含知识的自动文摘方法,旨在解决在对新闻文本的自动文摘中,因生成摘要包含错误的信息,不能正确反映新闻的主体信息,使得自动文摘的效果差的问题。该方法包括:获取待进行文摘提取的新闻文本;利用预先构建的文摘提取模型提取上述新闻文本的文摘;其中,文摘提取模型是基于编码器‑解码器的端到端模型;文摘提取模型中的编码器是基于预设的语料库,并利用多任务学习算法构建的编码模型,并且/或者文摘提取模型中的解码器是基于所述语料库,并利用增强学习算法构建的解码模型;语料库包括预设的新闻语料和该新闻语料对应的蕴含语料。本发明可以快速、准确的从新闻文本中自动文摘出新闻文本的摘要。

    基于改进的PageRank算法的文本‑音频自动文摘方法

    公开(公告)号:CN107015966A

    公开(公告)日:2017-08-04

    申请号:CN201710195609.2

    申请日:2017-03-28

    CPC classification number: G06F17/271 G06F17/2785 G10L15/26

    Abstract: 本发明提供了一种基于改进的PageRank算法的文本‑音频自动文摘方法,包括:将音频转录为文本,计算转录文本和原始文本的相似度;利用改进的PageRank算法根据相似度计算转录文本和原始文本中的句子的重要性;以及根据句子的重要性,生成文本摘要。通过改进PageRank算法,引导排序,修改了跨模态句子之间的相似度矩阵,使得来自不同模态的两个语义相同的句子之间的连接指向从原来的双向变为单向,实现了原始文本句子与转录文本句子语义相同时,按照原始文本句子进行输出,在保证获取较多重要信息量同时,避免了转录带来的语法错误和不通顺的问题,提高了文本‑音频自动文摘的可读性。

    离线强化学习训练方法、动作预测方法、装置及介质

    公开(公告)号:CN118153658A

    公开(公告)日:2024-06-07

    申请号:CN202410219901.3

    申请日:2024-02-28

    Abstract: 本申请公开了一种离线强化学习训练方法、动作预测方法、装置及介质,其中方法包括:获取待训练模型控制的机器人的第一静态数据集;第一静态数据集包括机器人的多条历史运行轨迹;待训练模型的网络包括价值函数网络、扩散模型网络和逆动力学网络;基于第一静态数据集对价值函数网络进行训练;基于训练后的价值函数网络生成历史运行轨迹的各个轨迹片段对应的性能标签;基于各个轨迹片段,以及各个性能标签对扩散模型网络和逆动力学网络进行训练。本申请提供的方法和装置,提高了扩散模型的学习准确度,提高了待训练模型的训练效率和预测准确度。

    面向地铁视觉图像的轨道检测方法及系统

    公开(公告)号:CN111611956B

    公开(公告)日:2023-09-26

    申请号:CN202010466033.0

    申请日:2020-05-28

    Abstract: 本发明涉及一种面向地铁视觉图像的轨道检测方法及系统,所述检测方法包括:采集地铁场景下的多个轨道图像,作为训练图像;通过基于卷积神经网络的特征提取网络,对训练图像进行特征提取,得到对应的图像特征;采用信息聚合算法,根据所述图像特征,得到基于轨道形状和分布特征的融合特征;根据所述融合特征,建立分类预测模型;根据所述分类预测模型,预测待处理轨道图像的各像素点的类别。本发明通过对训练图像特征提取,得到图像特征,进一步考虑轨道特殊的分布和形状特征,采用信息聚合算法,根据图像特征得到基于轨道形状和分布特征的融合特征;进而根据融合特征建立分类预测模型,可以准确、有效地预测出待处理轨道图像的各像素点的类别。

Patent Agency Ranking