一种文档检索的方法及装置

    公开(公告)号:CN103678412B

    公开(公告)日:2016-12-21

    申请号:CN201210360872.X

    申请日:2012-09-21

    Inventor: 洪毅虹 杨建武

    Abstract: 本发明提供一种文档检索的方法及装置,属于信息检索领域,包括:使用目标查询关键词在预先建立的倒排索引中对目标文档集合进行检索,得到第一目标文档集合,进行相关性打分,得到第一目标文档的相关性打分结果,并进行重排序得到第二目标文档集合;通过伪相关反馈模型对当前目标查询关键词进行扩展,得到新的目标查询关键词,进而得到第三目标文档集合;对第三目标文档集合中的目标文档进行分句处理,计算每个句子的标签权重总和;根据目标查询关键词对每个句子的内容进行相关性打分,得到每个句子的最终得分,从而得到目标句子;在目标句子中获取长度在预设长度范围内的句子作为检索结果片段。通过本发明,提高XML文档的检索性能和准确率。

    医学影像文件的获取方法、用户终端及主服务器

    公开(公告)号:CN106202848A

    公开(公告)日:2016-12-07

    申请号:CN201510225129.7

    申请日:2015-05-05

    Abstract: 本发明提供了一种医学影像文件的获取方法、用户终端及主服务器,该方法包括:接收用户发送的查询请求,查询请求中携带医学影像文件的第一标识信息;根据第一标识信息,获取与第一标识信息对应的医学影像序列文件的第二标识信息;向Hadoop平台的主服务器发送医学影像序列文件的获取请求,获取请求中携带用户终端标识信息和第二标识信息,以使主服务器根据预先存储的第二映射关系确定与第二标识信息对应的从服务器标识信息,并指示与从服务器标识信息对应的从服务器向与用户终端标识信息对应的用户终端,发送第二标识信息对应的医学影像序列文件,以便用户终端从医学影像序列文件获取与第一标识信息对应的医学影像文件。

    一种微博舆情事件的态势预测方法

    公开(公告)号:CN106156257A

    公开(公告)日:2016-11-23

    申请号:CN201510208798.3

    申请日:2015-04-28

    CPC classification number: G06F16/35 G06F16/958

    Abstract: 本发明提供了一种舆情事件的态势预测方法,包括:接收用户输入的待预测事件的名称及关键词表达式;根据所述名称和所述关键词表达式,获取与所述名称和所述关键词表达式匹配的所有数据;根据所述所有数据,确定所述待预测事件所属的领域;根据所述所有数据和所述待预测事件所属的领域,确定与所述待预测事件相匹配的事件发展模型,所述事件发展模型为预先采用所述领域内的历史事件建立的模型;采用所述事件发展模型对所述待预测事件的所有数据进行分析,获得所述待预测事件在未来时间点的预测态势发展情况。本发明所述是舆情事件的态势预测方法,解决了人工定性预测不准确及机器定量预测无法实现长期发展趋势预测的问题。

    信息识别方法和信息识别系统

    公开(公告)号:CN106156017A

    公开(公告)日:2016-11-23

    申请号:CN201510128025.4

    申请日:2015-03-23

    Inventor: 刘克松 杨建武

    Abstract: 本发明提出了一种信息识别方法和一种信息识别系统,其中,所述信息识别方法包括:通过特征词获取模块获取所述当前数据的特征词;通过关键词关联模块在关键词数据库中确定与所述特征词相关联的关键词;通过变异词确定模块确定所述关键词的多个变异词;通过匹配模块将所述特征词与所述多个变异词中的每个变异词进行匹配,以供根据匹配结果,确定是否将所述特征词识别为所述关键词。通过本发明的技术方案,可以准确地检测出经过变异的敏感信息,从而便于对敏感信息进行有效且全面的检测,避免出现敏感信息的漏检。

    一种热点信息处理方法和系统
    135.
    发明公开

    公开(公告)号:CN106033414A

    公开(公告)日:2016-10-19

    申请号:CN201510102754.2

    申请日:2015-03-09

    Abstract: 本发明公开一种热点信息处理方法和系统,所述方法包括:接收用户输入的网站类别和用于筛选热点信息的筛选条件;根据所述网站类别,搜索网站类别中各网站对应的网页;根据所述筛选条件,在搜索到的网页中获取与筛选条件相匹配的热点信息;将所述热点信息向用户展示。本发明的热点信息处理方法和系统可对同类型不同网站的热点信息进行抓取并聚合分组,提高用户获取特定类型的热点信息的效率。

    基于新闻客户端的数据采集方法及装置

    公开(公告)号:CN105989167A

    公开(公告)日:2016-10-05

    申请号:CN201510097088.8

    申请日:2015-03-04

    Abstract: 本发明提供了一种基于新闻客户端的数据采集方法及装置,其中采集方法包括:在用户访问移动终端上的新闻客户端时,获取当前新闻客户端的新闻链接地址;根据所述新闻链接地址,确定所述新闻客户端中当前频道的页面的数据结构;根据所述数据结构,查找与所述数据结构相匹配的数据采集模板;采用所述数据采集模板,对所述当前新闻客户端显示频道中的新闻数据进行采集,将所述采集到的新闻数据存储到数据库中。通过本发明提供的基于新闻客户端的数据采集方法及装置,能够对不同的新闻客户端进行数据的通用性的采集,同时对新闻客户端的不同频道进行新闻数据的通用采集,避免了对某个新闻客户端的单独采集,同时提高了采集的效率。

    一种命名实体识别的方法及装置

    公开(公告)号:CN103164426B

    公开(公告)日:2015-10-28

    申请号:CN201110414467.7

    申请日:2011-12-13

    CPC classification number: G06N5/022 G06F17/278 G06F17/30604 G06F17/30646

    Abstract: 本申请公开了一种用于识别命名实体的识别模型生成方法及装置、以及一种命名实体识别的方法及装置,所述命名实体识别方法包括:获得待训练文本的第一特征信息集;基于第一识别模型对待训练文本的第一特征信息集进行识别,获得第二特征信息集,所述第二特征信息集包含通过所述第一识别模型对所述第一特征信息集进行识别而获得的M个命名实体,所述M为大于或等于零的整数;基于错误驱动模型对所述第二特征信息集中的所述M个命名实体进行错误纠正,获得K个命名实体,所述K为大于或等于零、但小于等于M的整数。

    一种账户关系建立方法及设备

    公开(公告)号:CN104767672A

    公开(公告)日:2015-07-08

    申请号:CN201410009644.7

    申请日:2014-01-08

    Abstract: 本发明实施例涉及计算机技术领域,特别涉及一种映射关系建立方法及设备。本发明实施例的方法包括:从预先存储的交流平台登录信息集合中,依次选择交流平台登录信息;在选择一个交流平台登录信息后,向交流平台服务器发送所述选择的交流平台登录信息;在接收到所述交流平台服务器返回的所述选择的交流平台登录信息对应的权限值后,建立所述选择的交流平台登录信息与选择的交流平台用户标识之间的映射关系。本发明实施例提供的方案可自动建立交流平台登录信息与交流平台用户标识之间的映射关系,而不需要用户手动建立,大大提高了效率。

    验证方法及装置
    140.
    发明公开

    公开(公告)号:CN104424426A

    公开(公告)日:2015-03-18

    申请号:CN201310367200.6

    申请日:2013-08-21

    CPC classification number: G06F21/36 G06F2221/2133

    Abstract: 本发明提供一种验证方法及装置,其中,方法包括:选取至少两个图片作为待组合图片进行排列组合,获得验证码图片;生成包括多个待选框的复选框,每个待选框与每个待组合图片一一对应;从所述各待组合图片中,选取至少一个图片作为标准图片,且所述标准图片的数量小于所述各待组合图片的数量,存储所述标准图片的信息,并生成与所述标准图片对应的验证问题;向用户设备发送包括所述验证码图片、所述复选框和所述验证问题的验证码,以根据用户设备返回的选择结果完成验证。通过本发明提供的验证方法及装置无需在验证码图片中添加噪点,从而避免因验证码图片难以被用户识别导致的验证失败,进而提高验证的准确性。

Patent Agency Ranking