-
公开(公告)号:CN107330022A
公开(公告)日:2017-11-07
申请号:CN201710475018.0
申请日:2017-06-21
Applicant: 腾讯科技(深圳)有限公司
IPC: G06F17/30
CPC classification number: G06F16/3346 , G06F16/3334 , G06F16/35
Abstract: 一种获取热点话题的方法及装置,所述方法包括:获取待处理的语料集合,所述语料集合包括多个语料,每个语料包括多个词语,获取所述语料集合中各词语的热度信息;根据所述语料集合中各词语的热度信息,从所述语料集合中提取热词集合;基于信息熵从所述热词集合中提取包含多个候选热词组的候选热词组集合;基于候选热词组的热度信息和候选热词组的权重值,从所述候选热词组集合中提取目标热词组集合,将所述目标热词组集合作为热点话题集合。通过采用本方案,能够自动从海量短文本中获取热点话题,以及提高从海量文本中获取热点话题的效率与质量。
-
公开(公告)号:CN107301218A
公开(公告)日:2017-10-27
申请号:CN201710453152.0
申请日:2017-06-15
Applicant: 北京航天长征科技信息研究所 , 中国运载火箭技术研究院
IPC: G06F17/30
CPC classification number: G06F16/3334
Abstract: 本发明公开一种非相关文献隐形关联知识发现技术,包括以下步骤:1)确定主题的初始检索词;2)发现中间词、优化中间词以减少中间词数量并提高有意义中间词的排序、发现相应的中间文献集;3)发现目标词、优化目标词以减少目标词数量并提高有意义目标词的排序、发现相应的目标文献集;4)验证文献间的关联:当发现文献关联时,则结束判定过程;若未发现文献关联、且符合结束判定条件时,则结束判定过程;若未发现文献关联、且不符合结束判定条件时,则将步骤2)中获得的中间文献集作为初始集,重复步骤2)-4)。该方法大幅提高了非相关文献隐形关联知识发现的效率,能够有效为科研人员开展航天产品研发提供备选研究方向。
-
公开(公告)号:CN107220343A
公开(公告)日:2017-09-29
申请号:CN201710387493.2
申请日:2017-05-26
Applicant: 福州大学
CPC classification number: G06F16/3334 , G06F16/325 , G06F21/6209
Abstract: 本发明涉及一种基于局部敏感哈希的中文多关键词模糊排序密文搜索方法,将中文关键词转换成对应的拼音串后,基于声韵母和音调、unigram对拼音串分割;设计了三种中文关键词向量生成算法,将拼音串映射成关键词向量。并且,利用局部敏感哈希的特性和布隆过滤器来实现关键词的模糊匹配。本发明采用一篇文档对应一个布隆过滤器作为文档的加密索引,当加入新文档(或删除旧文档)时,无需更改原数据集的加密索引,只需构建新文档的加密索引(或删除旧文档的加密索引),就可实现文档的动态更新。为了提高排序结果的精确性,本发明引入了域加权评分,将关键词向量间的欧氏距离、词频权重和域加权评分结合,实现更为精确的三因子排序,返回更加满足用户需求的文档。
-
公开(公告)号:CN106649746A
公开(公告)日:2017-05-10
申请号:CN201611218888.1
申请日:2016-12-26
Applicant: 北京云知声信息技术有限公司
Inventor: 薛锐青
IPC: G06F17/30
CPC classification number: G06F16/3334 , G06F16/3329
Abstract: 本发明公开了一种答案获取方法及装置。方法包括:接收到需要目标终端应答的问题;获取目标终端的属性信息,其中,目标终端包括智能机器人,属性信息包括:年龄;根据目标终端的属性信息,获取与问题匹配的答案;控制目标终端输出答案。通过本发明的技术方案,在接收到需要目标终端应答的问题时,通过获取目标终端的属性信息如年龄,可以根据目标终端的年龄属性,获取与问题匹配的答案,进而控制目标终端输出该答案,从而使得目标终端可输出与其年龄属性相匹配的该问题的答案,这样可避免前后问题的答案与其年龄不一致的问题,有利于提高目标终端给出的答案的可信性和用户体验。
-
公开(公告)号:CN106339105A
公开(公告)日:2017-01-18
申请号:CN201610729886.2
申请日:2016-08-25
Applicant: 百度在线网络技术(北京)有限公司
CPC classification number: G06F3/0237 , G06F16/3334 , G06F17/277 , G06F17/2775
Abstract: 本申请公开了用于识别拼音信息的方法及装置。所述方法的一具体实施方式包括:获取用户通过终端输入的待识别拼音信息,待识别拼音信息用于获取对应该待识别拼音信息的词组输入信息和/短语输入信息;确定是否存在模糊音映射关系集合,若存在,则根据模糊音映射关系集合获取与待识别拼音信息对应的候选输入信息,否则,通过地理位置信息确定与待识别拼音信息对应的候选输入信息。该实施方式提高了对待识别拼音信息的识别准确率。
-
公开(公告)号:CN104699731A
公开(公告)日:2015-06-10
申请号:CN201410532346.6
申请日:2014-10-10
Applicant: 联想(新加坡)私人有限公司
Inventor: 罗德·D·沃特曼 , 赫尔曼·弗朗茨·布尔格迈尔 , 乔纳森·盖瑟·诺克斯 , 彼得·哈米尔顿·韦特塞尔 , 苏珊娜·玛丽恩·博蒙 , 拉塞尔·斯佩格特·范布恩
IPC: G06F17/30
CPC classification number: G06F16/24578 , G06F16/2477 , G06F16/3334 , G06F16/335 , G06F16/955
Abstract: 本发明一般地涉及利用境况数据确定用户的倾向,并公开了信息处理方法、信息处理装置以及信息处理产品。根据本发明一个方面的信息处理方法包括:基于用户境况信息,利用处理器访问用户简档,其中所述用户境况信息采用了用户装置事件;基于所述用户简档,利用所述处理器制备与特定时间段相关的项目列表,所述项目列表按照基于所述用户简档的重要性被组织;以及利用所述处理器呈现与所述特定时间段相关的所述项目列表。本发明还描述并且要求保护其他方面。
-
公开(公告)号:CN107730360A
公开(公告)日:2018-02-23
申请号:CN201711002457.6
申请日:2017-10-24
Applicant: 北京小度信息科技有限公司
CPC classification number: G06F16/3334 , G06F16/951 , G06Q30/0635
Abstract: 本公开提供了处方数据处理方法、设备和存储介质。该方法包括:接收第一应用发送的处方数据,所述处方数据包括处方单信息和处方数据标识,所述处方单信息包括处方药通用名;响应于第二应用的查询请求,根据第二应用发送的查询请求中的处方数据标识查找与所述处方数据标识对应的处方数据;根据查找到的处方数据中的处方药通用名查找与所述处方药通用名对应的处方药商品名以及相关商品信息;向所述第二应用发送查找到的处方药商品名以及相关商品信息,以便第二应用展示。通过上述方法,能够根据处方向用户提供对应的处方药,监管处方药的销售,而且能够为用户提供处方药对应的多种商品名,方便用户选择相关处方药。
-
公开(公告)号:CN107145555A
公开(公告)日:2017-09-08
申请号:CN201710296379.9
申请日:2017-04-28
Applicant: 北京安数云信息技术有限公司
IPC: G06F17/30
CPC classification number: G06F16/9535 , G06F16/3334
Abstract: 本发明公开了一种基于分词的模糊语句搜索方法,该方法通过对原文进行分词,记录分词起始位置;对重复出现的词语合并,记录重复出现的词语起始位置;对关键字进行分词,关键字分词的个数记为i,原文中至少出现一次的关键字分词的个数记为w;计算出现率p,出现率p大于预设值,用关键字的分词结果进行搜索,得到关键字分词在原文中位置,出现率p小于预设值,退出搜索;计算关键字分词在原文中位置之间的距离d,比较距离d与相应关键词自身长度之间的差值k是否在容许的数值范围内,差值k在容许的数值范围内,匹配到模糊搜索的结果。本发明可以实现对做过混淆、词语顺序跟换过的语句进行检索,检索结果更加准确,提高了检索效率。
-
公开(公告)号:CN107092674A
公开(公告)日:2017-08-25
申请号:CN201710245442.6
申请日:2017-04-14
Applicant: 福建工程学院
Inventor: 孙水华
IPC: G06F17/30
CPC classification number: G06F16/3334 , G06F16/335
Abstract: 本发明提供一种中医针灸领域事件触发词的自动抽取方法和系统,先由人工预定义中医针灸事件模板并构建中医针灸事件的标注语料库;设计初始触发词表构建法根据所述标注语料库构建中医针灸事件的初始触发词表;设计触发词扩展算法对所述初始触发词表进行扩展;设计候选触发词抽取算法以基于中医针灸事件触发词扩展表对候选针灸事件的触发词进行抽取;设计触发词过滤规则以对候选针灸事件的触发词进行过滤;将所述初始触发词表构建法、触发词扩展算法、候选触发词抽取算法以及触发词过滤规则构建为触发词自动抽取模型,从而实现中医针灸领域事件触发词的自动抽取。
-
公开(公告)号:CN106897388A
公开(公告)日:2017-06-27
申请号:CN201710059472.8
申请日:2017-01-24
Applicant: 北京航空航天大学
CPC classification number: G06F16/3346 , G06F16/3334 , G06N3/08
Abstract: 本发明提供一种预测微博事件热度的方法及装置。本发明提供的预测微博事件热度的方法包括:获取与微博事件相关联的K个第一关键词,并获取各第一关键词各自在当前日的当前热度值;其中,K≥2,且K为正整数;以各当前热度值作为输入,通过基于门控循环单元GRU的循环神经网络模型预测得到所述微博事件在下一日的目标热度值。本发明的预测微博事件热度的方法及装置,对微博事件预测日的预测结果准确且预测耗时少。
-
-
-
-
-
-
-
-
-