挂载问题到主题的方法和系统

    公开(公告)号:CN104077330B

    公开(公告)日:2019-05-07

    申请号:CN201310110075.0

    申请日:2013-03-30

    Inventor: 谢双宾

    Abstract: 本发明提供了一种挂载问题到主题的方法,该方法包括以下步骤:接收所输入的检索词,基于所述检索词检索相应主题并根据所述主题到问题索引库中检索包含所述主题的问题列表;计算所述问题列表中每个问题的相关性值并基于所述相关性值对所述问题进行排序,设定一阈值,将所述相关性值大于所述阈值的问题返回;计算各个已返回问题的综合值并基于所述综合值对所返回问题进行排序,并按序取特定数量的已返回问题存入结果数据文件。相应地还提供了一种挂载问题到主题的系统。本发明提供的方法及系统可以提升用户对问题进行延伸的浏览体验。

    一种确定候选查询序列的综合相关度的方法与装置

    公开(公告)号:CN104572836A

    公开(公告)日:2015-04-29

    申请号:CN201410758913.X

    申请日:2014-12-10

    Inventor: 谢双宾 赵万里

    CPC classification number: G06F16/951

    Abstract: 本发明的目的是提供一种确定特定应用中候选查询序列的综合相关度的方法与装置。其中,本发明通过从一特定应用的会话数据中获得基准查询序列以及与该基准查询序列相对应的一个或多个候选查询序列,并基于该(等)候选查询序列的各种相关度,确定该(等)候选查询序列与该基准查询序列的综合相关度,其中,候选查询序列的各种相关度包括以下至少任一项:1)候选查询序列与基准查询序列的共现相关度;2)候选查询序列与基准查询序列的相似相关度;3)候选查询序列对应于特定应用的需求相关度。本发明提出了一种针对特定应用来确定候选查询序列的综合相关度的方案,其不同于现有技术中用于通用搜索引擎的候选查询序列的确定方案。

    电子书的处理方法和装置

    公开(公告)号:CN104239282A

    公开(公告)日:2014-12-24

    申请号:CN201410455662.8

    申请日:2014-09-09

    Abstract: 本发明提供一种电子书的处理方法和装置。所述处理方法包括:获取电子书多个页面的页面内容数据;从所述页面内容数据识别文字行块和图,其中,每个文字行块包括单个文字行或具有相同属性的连续的文字行;基于识别出的图和文字行块确定图注识别特征;根据确定的图注识别特征为识别出的图标注图注。如此,能够自动完成图与图注的关联识别,优化图文类电子书的线上展示,能够保障其在线上重排版展示时不会出现格式错乱,并提高数据处理效率,减少人工编辑的成本,以及提高图注识别的准确率。

    一种获取与输入问题相对应的相关问题的方法与设备

    公开(公告)号:CN104123320B

    公开(公告)日:2019-06-28

    申请号:CN201310156783.8

    申请日:2013-04-28

    Inventor: 谢双宾 梁龙军

    Abstract: 本发明的目的是提供一种用于获取与输入问题相对应的相关问题的方法与设备;获取用户输入的输入问题;对所述输入问题进行分词处理,以确定待处理词组;根据所述待处理词组所对应的索引拉链及权重值,确定其中的归并词组;对所述归并词组所对应的索引问题进行归并处理,确定与所述输入问题相对应的相关问题。与现有技术相比,本发明对输入问题进行分词处理,确定待处理的词组,并结合其对应的索引拉链和权重值,确定其中的归并词组,进而,对该归并词组对应的索引问题进行归并处理,获得与用户输入问题对应的相关问题,在保证问题的相关性的前提下同时极大提高了检索速度,提升了用户使用体验。

    挂载问题到主题的方法和系统

    公开(公告)号:CN104077330A

    公开(公告)日:2014-10-01

    申请号:CN201310110075.0

    申请日:2013-03-30

    Inventor: 谢双宾

    CPC classification number: G06F17/30864

    Abstract: 本发明提供了一种挂载问题到主题的方法,该方法包括以下步骤:接收所输入的检索词,基于所述检索词检索相应主题并根据所述主题到问题索引库中检索包含所述主题的问题列表;计算所述问题列表中每个问题的相关性值并基于所述相关性值对所述问题进行排序,设定一阈值,将所述相关性值大于所述阈值的问题返回;计算各个已返回问题的综合值并基于所述综合值对所返回问题进行排序,并按序取特定数量的已返回问题存入结果数据文件。相应地还提供了一种挂载问题到主题的系统。本发明提供的方法及系统可以提升用户对问题进行延伸的浏览体验。

    基于问题的地理信息挖掘方法及系统

    公开(公告)号:CN104077322A

    公开(公告)日:2014-10-01

    申请号:CN201310108951.6

    申请日:2013-03-30

    Inventor: 谢双宾

    CPC classification number: G06F16/29

    Abstract: 本发明提供了一种基于问题的地理信息挖掘方法,该方法包括以下步骤:初始化兴趣点词典、城市名称词典和IP地址与城市名称的映射词典信息;接收用户提交的问题并获取用户的IP地址信息;从所述问题或/和IP地址信息中挖掘所述问题对应的词典项信息;基于所述对应的词典项信息访问地图的位置接口,并获得该接口所返回的地图数据列表;根据所获得的地图数据列表,请求地图地址解析接口进行解析,获取上层地理信息;返回所述上层地理信息。相应地,还提供了一种基于问题的地理信息挖掘系统。本发明提供的方法和系统可以有效地挖掘问题中的地理信息。

    一种基于地理信息的问题推送方法及系统

    公开(公告)号:CN102279889A

    公开(公告)日:2011-12-14

    申请号:CN201110250083.6

    申请日:2011-08-29

    Abstract: 本发明提供了一种基于地理信息的问题推送方法及系统,其问题推送方法预先根据用户属性信息中的地理词建立各用户的用户地理模型,包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户。本发明通过用户填写的个人信息挖掘用户的地理兴趣词模型,给具有地理位置属性的用户推送具有同样地理位置属性的问题,使问题推送更加精确,减小服务器和客户端的负担和资源浪费。

    电子书的处理方法和装置

    公开(公告)号:CN104239282B

    公开(公告)日:2017-11-14

    申请号:CN201410455662.8

    申请日:2014-09-09

    Abstract: 本发明提供一种电子书的处理方法和装置。所述处理方法包括:获取电子书多个页面的页面内容数据;从所述页面内容数据识别文字行块和图,其中,每个文字行块包括单个文字行或具有相同属性的连续的文字行;基于识别出的图和文字行块确定图注识别特征;根据确定的图注识别特征为识别出的图标注图注。如此,能够自动完成图与图注的关联识别,优化图文类电子书的线上展示,能够保障其在线上重排版展示时不会出现格式错乱,并提高数据处理效率,减少人工编辑的成本,以及提高图注识别的准确率。

    一种基于地理信息的问题推送方法及系统

    公开(公告)号:CN102279889B

    公开(公告)日:2017-06-30

    申请号:CN201110250083.6

    申请日:2011-08-29

    Abstract: 本发明提供了一种基于地理信息的问题推送方法及系统,其问题推送方法预先根据用户属性信息中的地理词建立各用户的用户地理模型,包括:A、获取用户提交的问题,并从所述问题中提取地理词;B、利用提取的地理词与各用户地理模型进行匹配,利用匹配到的用户地理模型对应的用户形成用户列表;C、将所述问题推送给所述用户列表中的用户。本发明通过用户填写的个人信息挖掘用户的地理兴趣词模型,给具有地理位置属性的用户推送具有同样地理位置属性的问题,使问题推送更加精确,减小服务器和客户端的负担和资源浪费。

    基于同义处理获取与输入问题对应的相关问题的方法、设备

    公开(公告)号:CN104123322A

    公开(公告)日:2014-10-29

    申请号:CN201310156975.9

    申请日:2013-04-28

    Inventor: 谢双宾

    CPC classification number: G06F17/30421

    Abstract: 本发明的目的是提供一种用于基于同义处理获取与输入问题对应的相关问题的方法与设备;对用户输入的输入问题进行分词处理,以获得待处理词组;根据所述待处理词组,确定与所述待处理词组同义的同义词组;根据所述待处理词组及对应的同义词组,在问题索引库中进行匹配查找,确定与所述待处理词组或所述同义词组相对应的索引问题;根据所述索引问题的相关性得分,确定与所述输入问题相对应的相关问题并提供给所述用户。与现有技术相比,本发明由于在相关问题计算过程中引入了同义处理,提升了相关问题的相关性,提高了检索的效率,提升了用户的搜索使用体验。

Patent Agency Ranking