一种基于文本内容的信息源识别方法与装置

    公开(公告)号:CN107451433A

    公开(公告)日:2017-12-08

    申请号:CN201710499053.6

    申请日:2017-06-27

    Abstract: 本发明提供一种基于文本内容的信息源识别方法,适用于非结构化的文本,即自由文本,包括以下步骤:将输入的文本按句子切分并分词;识别出各句子中包含的类型为信息源的实体;如所述实体为其所在句子的信息源,则将其作为一信息源实体;整合各句子得到的信息源实体,作为文本信息识别结果。可以不依赖于网页结构化信息,不依赖于人工特征提取,通过分析文本内容,自动识别非结构化文本的信息源。同时提供对应实现上述方法的装置。

    一种复杂背景图像中的文本定位方法

    公开(公告)号:CN105825216A

    公开(公告)日:2016-08-03

    申请号:CN201610153384.X

    申请日:2016-03-17

    CPC classification number: G06K9/325 G06K2209/01

    Abstract: 本发明公开了一种复杂背景图像中的文本定位方法。本方法为:1)在待处理的彩色图像的R、G和B三个通道上分别使用MSERs算法进行处理,得到对应三个通道上的MSERs区域;然后将得到的结果标记在该彩色图像上,得到每个MSERs区域在彩色图像上的坐标;2)进行初步去噪,去掉判断为重复的MSERs区域和非文本的MSERs区域,得到候选MSERs区域;3)从得到的候选MSERs区域中提取设定特征,然后利用一基于该设定特征训练的分类器对候选MSERs区域分类,得到包含文本的MSERs区域,即文本块;4)将得到的文本块连接成文本条;5)对得到的文本条进行去重处理。本发明大大提高了文本定位效率。

    一种微博热点事件的地理位置发现方法

    公开(公告)号:CN105630884A

    公开(公告)日:2016-06-01

    申请号:CN201510957634.0

    申请日:2015-12-18

    CPC classification number: G06F17/3087 G06F17/30705

    Abstract: 本发明公开了一种微博热点事件的地理位置发现方法。本方法为:1)基于行政区规划地理词词典及中文简称词的命名规则构建一简称词词典,然后将该简称词词典与全称词词典进行关联;2)根据事件关键字,获取包含该事件关键字的微博信息;3)对获取的微博信息进行分词处理,得到该微博的分词集合,然后判断该分词集合中每一名词是否在该简称词词典或全称词词典中,如果存在则将该名词作为候选地理位置词保留;当该微博中出现多个候选地理位置词时,则选取一候选地理位置词作为该微博的地点;4)获取确定的每一地点的地理位置经纬度信息,然后对得到的地理位置经纬度信息进行聚类,根据聚类中心判断出事件爆发地点。本方法可更好的了解突发事件。

    一种基于共同视觉模式的图像查询扩展方法及系统

    公开(公告)号:CN104008146A

    公开(公告)日:2014-08-27

    申请号:CN201410196803.9

    申请日:2014-05-09

    CPC classification number: G06F17/30247

    Abstract: 本发明涉及一种基于共同视觉模式的图像查询扩展方法及系统,包括视觉关键词级查询扩展和图像级查询扩展,视觉关键词级查询扩展是在离线时构建一个训练图像库,挖掘训练图像库中各图像间的CVP,根据CVP计算每一个视觉关键词的上下文同义词并保存,在线查询时,将待查询的视觉关键词扩展到其上下文同义词,并在原始图像库中查询;图像级查询扩展是在视觉关键词级查询扩展的基础上进行的,通过视觉关键词级查询得到初始结果,计算查询图像与初始结果中相似的n幅图像间的CVP,以CVP为线索,找到训练图像库中的相似图像,根据查询图像和相似图像在原始图像库中进行查询;本发明提供多种查询方式,在提高检索精度的同时保证了检索速度。

    一种基于门控循环单元的内部威胁检测方法和装置

    公开(公告)号:CN113472742B

    公开(公告)日:2022-09-27

    申请号:CN202110588732.7

    申请日:2021-05-28

    Abstract: 本发明涉及一种基于门控循环单元的内部威胁检测方法和装置。该方法的步骤包括:解析用户审计日志以获取用户动作信息,将每个用户的动作按照时间先后顺序构建用户动作序列;利用门控循环单元GRU从用户动作序列中提取用户行为的时序特征;将提取的时序特征输入LR分类器进行分类,判别其为正常或异常,从而实现内部威胁检测。本发明融合多域的用户活动记录以全面地刻画用户行为,GRU可以更好地捕获用户动作序列的长期依赖,该方案能够实现用户行为细粒度的分析并提高了内部威胁检测的准确率。

    一种基于深度强化学习的恶意域名检测方法和装置

    公开(公告)号:CN114050912A

    公开(公告)日:2022-02-15

    申请号:CN202111158750.8

    申请日:2021-09-30

    Abstract: 本发明涉及一种基于深度强化学习的恶意域名检测方法和装置。该方法的步骤包括:获取待检测域名的真实DNS流量;查询并记录真实DNS流量中待检测域名的whois信息;根据待检测域名本身以及whois信息,对待检测域名进行特征提取,生成待检测域名的特征向量;将待检测域名的特征向量输入至深度强化学习模型中,判断待检测域名是否具有恶意行为。本发明使用基于深度强化学习的方法来解决真实DNS流量中良性与恶意样本数据不平衡的分类问题,能够快速有效地发现真实DNS流量中存在的低比例恶意样本,在低平衡率时依旧保持较好的效果。

Patent Agency Ranking