一种基于生成对抗网络的中文摘要生成方法和装置

    公开(公告)号:CN109766432A

    公开(公告)日:2019-05-17

    申请号:CN201810765723.9

    申请日:2018-07-12

    Abstract: 本发明涉及一种基于生成对抗网络的中文摘要生成方法和装置。该方法包括:1)通过对给定的中文数据集进行预处理操作形成训练集;2)构建基于生成对抗网络的中文摘要生成模型,并使用训练集对中文摘要生成模型进行训练;3)将待生成摘要的中文文本输入到训练完毕的中文摘要生成模型,得到对应的摘要。本发明使用判别器最小化误差来代替最大生成摘要概率的框架;特别设计了由3个LSTMs组成的判别器,能够更好地捕获特征,辅助分类效果;提出使用以字为单位结合上下文,能够有效提升文本摘要的效率。本发明能够对大规模中文文本进行摘要的自动生成,生成的摘要更自然、连贯,具有可读性。

    一种面向多模式图匹配的并行加速方法

    公开(公告)号:CN109614520A

    公开(公告)日:2019-04-12

    申请号:CN201811228936.4

    申请日:2018-10-22

    Abstract: 本发明公开了一种面向多模式图匹配的并行加速方法。本方法为:1)生成目标领域的模式图集的多模式图索引;2)对所述多模式图索引采用逐层分组策略,即对所述多模式图索引中每一层出现的模式图进行评估,得到该层中每个模式图的匹配代价,然后根据匹配代价对该层的模式图进行分组;3)对不同分组分别分配一线程同时进行匹配计算。本发明通过采用PatternTree索引构建算法挖掘模式图间存在的结构相关性,对于结构相关性较弱的模式图设计并行匹配策略进一步提升匹配性能。

    数字查找树的压缩表示方法、系统、存储介质及规则匹配装置

    公开(公告)号:CN108399152A

    公开(公告)日:2018-08-14

    申请号:CN201810119184.1

    申请日:2018-02-06

    Abstract: 本发明涉及一种数字查找树的压缩表示方法、系统、存储介质及规则匹配装置。该方法包括:采用完全矩阵表示法建立数字查找树的结点,并建立状态转换表;建立基值表,并利用数组记录叶子结点状态中对应的规则编号;利用基值表对状态行进行归一化,生成归一化矩阵;利用数组来记录归一化矩阵的状态,对归一化矩阵的状态进行去重,得到约简的状态转移矩阵;利用位图对约简的状态转移矩阵进行修正,使其中的元素能够用一个字节来表示;利用基值表、记录归一化矩阵状态的数组、位图和修正后的矩阵进行状态的匹配,并输出匹配结果。本发明以完全矩阵表示法为原型,能够保证结点间状态转移的时间复杂度为O(1),同时可大幅度减少数据结构的存储空间。

    一种跨域用户关联方法及信息推送方法

    公开(公告)号:CN104951499B

    公开(公告)日:2018-03-02

    申请号:CN201510199720.X

    申请日:2015-04-23

    Abstract: 本发明公开了一种跨域用户关联方法及信息推送方法。本方法为:1)从网络中收集HTTP包,并按照设定的时间窗口对采集的包划分;2)对每一窗口内的包,根据FixCookie列表进行聚类,将同一用户的一次请求聚在一起,然后将各窗口内相同用户的用户组集合合并为一个用户组集合;3)对采集的包进行聚类,将主机名、cookie名和值相同的包聚为一组,将同一组内的包对应的用户组集合合并;4)对采集的包进行聚类,将主机名、cookie名和值相同且不存在fixCookie冲突的包聚为一组,将同一组内的包对应的用户组集合合并;5)将位于4)中同一用户组集合内的用户判定为不同域中的同一用户。本方法准确率高,聚类效果好。

    一种基于微博的事件实时监测方法及系统

    公开(公告)号:CN103955505B

    公开(公告)日:2017-09-26

    申请号:CN201410168703.5

    申请日:2014-04-24

    Abstract: 本发明涉及一种基于微博的事件实时监测方法及系统,所述方法包括:异常事件检测步骤,输入事件关键词,统计与事件关键词相关的微博数量,采用波峰识别方法将统计的微博数量以曲线图展示,将曲线图中的波峰时间作为事件的异常时间点,将存在异常时间点的事件作为异常事件;地理位置定位步骤,在与异常事件相关的微博文本内容中,抽取出地理位置实体,并采用聚类方法从抽取的地理位置实体中筛选出异常事件发生的地理位置。此外,还包括有相关事件推荐步骤和/或事件相关度分析步骤。本发明对用户所关心的事件进行实时监测,监控该事件在微博平台上的传播和发展趋势,能精准地挖掘出事件发生的异常时间点和地理位置,并推荐给用户其感兴趣的话题。

    一种基于共同视觉模式的图像查询扩展方法及系统

    公开(公告)号:CN104008146B

    公开(公告)日:2017-02-15

    申请号:CN201410196803.9

    申请日:2014-05-09

    Abstract: 本发明涉及一种基于共同视觉模式的图像查询扩展方法及系统,包括视觉关键词级查询扩展和图像级查询扩展,视觉关键词级查询扩展是在离线时构建一个训练图像库,挖掘训练图像库中各图像间的CVP,根据CVP计算每一个视觉关键词的上下文同义词并保存,在线查询时,将待查询的视觉关键词扩展到其上下文同义词,并在原始图像库中查询;图像级查询扩展是在视觉关键词级查询扩展的基础上进行的,通过视觉关键词级查询得到初始结果,计算查询图像与初始结果中相似的n幅图像间的CVP,以CVP为线索,找到训练图像库中的相似图像,根据查询图像和相似图像在原始图像库中进行查询;本发明提供多种查询方式,在提高检索精度的同时保证了检索速度。

    一种针对特定群体的微博热点话题检测方法及装置

    公开(公告)号:CN103823890B

    公开(公告)日:2016-11-02

    申请号:CN201410085760.7

    申请日:2014-03-10

    Abstract: 本发明涉及一种针对特定群体的微博热点话题检测方法及装置,包括以下步骤:根据认证用户与被认证用户关注的用户之间的关注关系对微博中的所有用户进行社区分类;根据获取的各个认证用户及其关注的用户发布的微博的内容抽取话题,得到多个概要话题类;根据用户社区和概要话题类构建社区话题矩阵;将与微博文本矢量对应的微博文本放到与微博文本矢量的余弦相似度最大的概要话题类中;选取社区话题矩阵中若干个矩阵元素数值最大的概要话题类分别进行聚簇分类,分别提取每个事件聚簇类的中心热点事件,并将得到的中心热点事件展示给对应的用户社区。本发明获取热点话题事件的多层次结果,最终通过微博来代表某个社区所感兴趣的热点事件。

Patent Agency Ranking