一种获取热点话题的方法及装置

    公开(公告)号:CN107330022A

    公开(公告)日:2017-11-07

    申请号:CN201710475018.0

    申请日:2017-06-21

    CPC classification number: G06F16/3346 G06F16/3334 G06F16/35

    Abstract: 一种获取热点话题的方法及装置,所述方法包括:获取待处理的语料集合,所述语料集合包括多个语料,每个语料包括多个词语,获取所述语料集合中各词语的热度信息;根据所述语料集合中各词语的热度信息,从所述语料集合中提取热词集合;基于信息熵从所述热词集合中提取包含多个候选热词组的候选热词组集合;基于候选热词组的热度信息和候选热词组的权重值,从所述候选热词组集合中提取目标热词组集合,将所述目标热词组集合作为热点话题集合。通过采用本方案,能够自动从海量短文本中获取热点话题,以及提高从海量文本中获取热点话题的效率与质量。

    一种非相关文献隐性关联知识发现方法

    公开(公告)号:CN107301218A

    公开(公告)日:2017-10-27

    申请号:CN201710453152.0

    申请日:2017-06-15

    CPC classification number: G06F16/3334

    Abstract: 本发明公开一种非相关文献隐形关联知识发现技术,包括以下步骤:1)确定主题的初始检索词;2)发现中间词、优化中间词以减少中间词数量并提高有意义中间词的排序、发现相应的中间文献集;3)发现目标词、优化目标词以减少目标词数量并提高有意义目标词的排序、发现相应的目标文献集;4)验证文献间的关联:当发现文献关联时,则结束判定过程;若未发现文献关联、且符合结束判定条件时,则结束判定过程;若未发现文献关联、且不符合结束判定条件时,则将步骤2)中获得的中间文献集作为初始集,重复步骤2)-4)。该方法大幅提高了非相关文献隐形关联知识发现的效率,能够有效为科研人员开展航天产品研发提供备选研究方向。

    基于局部敏感哈希的中文多关键词模糊排序密文搜索方法

    公开(公告)号:CN107220343A

    公开(公告)日:2017-09-29

    申请号:CN201710387493.2

    申请日:2017-05-26

    Applicant: 福州大学

    CPC classification number: G06F16/3334 G06F16/325 G06F21/6209

    Abstract: 本发明涉及一种基于局部敏感哈希的中文多关键词模糊排序密文搜索方法,将中文关键词转换成对应的拼音串后,基于声韵母和音调、unigram对拼音串分割;设计了三种中文关键词向量生成算法,将拼音串映射成关键词向量。并且,利用局部敏感哈希的特性和布隆过滤器来实现关键词的模糊匹配。本发明采用一篇文档对应一个布隆过滤器作为文档的加密索引,当加入新文档(或删除旧文档)时,无需更改原数据集的加密索引,只需构建新文档的加密索引(或删除旧文档的加密索引),就可实现文档的动态更新。为了提高排序结果的精确性,本发明引入了域加权评分,将关键词向量间的欧氏距离、词频权重和域加权评分结合,实现更为精确的三因子排序,返回更加满足用户需求的文档。

    一种答案获取方法及装置
    14.
    发明公开

    公开(公告)号:CN106649746A

    公开(公告)日:2017-05-10

    申请号:CN201611218888.1

    申请日:2016-12-26

    Inventor: 薛锐青

    CPC classification number: G06F16/3334 G06F16/3329

    Abstract: 本发明公开了一种答案获取方法及装置。方法包括:接收到需要目标终端应答的问题;获取目标终端的属性信息,其中,目标终端包括智能机器人,属性信息包括:年龄;根据目标终端的属性信息,获取与问题匹配的答案;控制目标终端输出答案。通过本发明的技术方案,在接收到需要目标终端应答的问题时,通过获取目标终端的属性信息如年龄,可以根据目标终端的年龄属性,获取与问题匹配的答案,进而控制目标终端输出该答案,从而使得目标终端可输出与其年龄属性相匹配的该问题的答案,这样可避免前后问题的答案与其年龄不一致的问题,有利于提高目标终端给出的答案的可信性和用户体验。

    订单数据处理方法、设备和存储介质

    公开(公告)号:CN107730360A

    公开(公告)日:2018-02-23

    申请号:CN201711002457.6

    申请日:2017-10-24

    Inventor: 苗芊 白大伟

    CPC classification number: G06F16/3334 G06F16/951 G06Q30/0635

    Abstract: 本公开提供了处方数据处理方法、设备和存储介质。该方法包括:接收第一应用发送的处方数据,所述处方数据包括处方单信息和处方数据标识,所述处方单信息包括处方药通用名;响应于第二应用的查询请求,根据第二应用发送的查询请求中的处方数据标识查找与所述处方数据标识对应的处方数据;根据查找到的处方数据中的处方药通用名查找与所述处方药通用名对应的处方药商品名以及相关商品信息;向所述第二应用发送查找到的处方药商品名以及相关商品信息,以便第二应用展示。通过上述方法,能够根据处方向用户提供对应的处方药,监管处方药的销售,而且能够为用户提供处方药对应的多种商品名,方便用户选择相关处方药。

    一种基于分词的模糊语句搜索方法

    公开(公告)号:CN107145555A

    公开(公告)日:2017-09-08

    申请号:CN201710296379.9

    申请日:2017-04-28

    Inventor: 常帅 邓皓钟

    CPC classification number: G06F16/9535 G06F16/3334

    Abstract: 本发明公开了一种基于分词的模糊语句搜索方法,该方法通过对原文进行分词,记录分词起始位置;对重复出现的词语合并,记录重复出现的词语起始位置;对关键字进行分词,关键字分词的个数记为i,原文中至少出现一次的关键字分词的个数记为w;计算出现率p,出现率p大于预设值,用关键字的分词结果进行搜索,得到关键字分词在原文中位置,出现率p小于预设值,退出搜索;计算关键字分词在原文中位置之间的距离d,比较距离d与相应关键词自身长度之间的差值k是否在容许的数值范围内,差值k在容许的数值范围内,匹配到模糊搜索的结果。本发明可以实现对做过混淆、词语顺序跟换过的语句进行检索,检索结果更加准确,提高了检索效率。

    一种中医针灸领域事件触发词的自动抽取方法及系统

    公开(公告)号:CN107092674A

    公开(公告)日:2017-08-25

    申请号:CN201710245442.6

    申请日:2017-04-14

    Inventor: 孙水华

    CPC classification number: G06F16/3334 G06F16/335

    Abstract: 本发明提供一种中医针灸领域事件触发词的自动抽取方法和系统,先由人工预定义中医针灸事件模板并构建中医针灸事件的标注语料库;设计初始触发词表构建法根据所述标注语料库构建中医针灸事件的初始触发词表;设计触发词扩展算法对所述初始触发词表进行扩展;设计候选触发词抽取算法以基于中医针灸事件触发词扩展表对候选针灸事件的触发词进行抽取;设计触发词过滤规则以对候选针灸事件的触发词进行过滤;将所述初始触发词表构建法、触发词扩展算法、候选触发词抽取算法以及触发词过滤规则构建为触发词自动抽取模型,从而实现中医针灸领域事件触发词的自动抽取。

    预测微博事件热度的方法及装置

    公开(公告)号:CN106897388A

    公开(公告)日:2017-06-27

    申请号:CN201710059472.8

    申请日:2017-01-24

    CPC classification number: G06F16/3346 G06F16/3334 G06N3/08

    Abstract: 本发明提供一种预测微博事件热度的方法及装置。本发明提供的预测微博事件热度的方法包括:获取与微博事件相关联的K个第一关键词,并获取各第一关键词各自在当前日的当前热度值;其中,K≥2,且K为正整数;以各当前热度值作为输入,通过基于门控循环单元GRU的循环神经网络模型预测得到所述微博事件在下一日的目标热度值。本发明的预测微博事件热度的方法及装置,对微博事件预测日的预测结果准确且预测耗时少。

Patent Agency Ranking