一种目标语句识别方法及装置

    公开(公告)号:CN107783958A

    公开(公告)日:2018-03-09

    申请号:CN201610792978.5

    申请日:2016-08-31

    CPC classification number: G06F17/2765 G06F17/2785

    Abstract: 本发明实施例提供了一种目标语句识别方法及装置,其中方法包括:获取待处理的文本,其中所述文本包含一条或多条自然语言语句;提取每条所述语句的识别特征,其中所述识别特征包括第一特征和\或第二特征,所述第一特征用于指示所述语句在语义方面的特征,所述第二特征用于指示所述语句在文字方面的特征;根据预先构建的目标语句识别模型及所述文本中每条所述语句的识别特征,识别出所述文本中的目标语句。本发明可自动发现属于目标语句(例如优美句子)的语句,从而大大提高了目标语句的识别效率;同时,本发明的识别标准是基于客观的特征及模型,使得识别结果也较为客观,从而避免了人工识别时的主观性问题。

    一种创新创意的大数据处理方法、服务器及系统

    公开(公告)号:CN107330627A

    公开(公告)日:2017-11-07

    申请号:CN201710543193.9

    申请日:2017-07-05

    Applicant: 山东大学

    Abstract: 本发明公开了一种创新创意的大数据处理方法、服务器及系统,其中该方法在大数据处理服务器内完成,包括步骤1:爬取多源异构的创新大数据,并集合生成具有层次关联关系的创新知识网络;步骤2:接收客户端输入的创意需求描述,得到创新关键词,计算创新关键词与创新知识网络中的关键词的关联度和层次关联关系的紧密度,并进行相关信息标注,生成初始创新方案;步骤3:将初始创新方案发送至评价服务器,并在评价服务器内依据预设评分标准对初始创新方案进行评分;步骤4:接收评价服务器的评分并与方案合格评分阈值相比较,若前者大于后者,则初始创新方案为可行创新方案;否则,返回步骤2,直至得到可行创新方案。

    一种指数计算平台和方法
    17.
    发明公开

    公开(公告)号:CN107315775A

    公开(公告)日:2017-11-03

    申请号:CN201710391942.0

    申请日:2017-05-27

    Inventor: 马宁 段立新 王肃

    Abstract: 本发明公开了一种指数计算平台,包括:数据获取模块,用于获取进行指数计算的数据;指标体系构建模块,用于基于获取的数据构建指标体系;特征选择模块,用于对指标体系确定的指标进行特征选择,确定指数计算使用的特征;权重确定模块,用于将确定的特征对应的特征值以及作为目标变量的初始指数值输入预设深度学习模型,采用深度神经网络进行迭代训练,得到各特征分别对应的权重;权重和指数调整模块,用于按照预设周期收集关于当前指数值的监督信息,并基于该监督信息来调整各特征的权重和得到新的当前指数值。本发明还提供一种指数计算方法。本发明确定的当前指数值能够准确的反映最新状态。

    敏感文本检测方法及装置

    公开(公告)号:CN104866465B

    公开(公告)日:2017-11-03

    申请号:CN201410064854.6

    申请日:2014-02-25

    Inventor: 张红林

    Abstract: 本发明公开了一种敏感文本检测方法及装置,属于信息处理技术领域。方法包括:获取当前检测文本的特征文本字符串;根据预先建立的有限自动状态机对特征文本字符串进行检测,得到每个关键词在特征文本字符串中的出现频率;对于多个关键词类别中的每个关键词类别,基于关键词类别对应的每个关键词的出现频率及每个关键词的预设权重,计算关键词类别在文本中的权重;当至少一个关键词类别的权重大于预设阈值时,确定文本为敏感文本。本发明根据预先建立的有限自动状态机对特征文本字符串进行检测时,仅需进行一次从头至尾的扫描,所以提高了检测效率,加快了检测速度;且在确定敏感文本时,还需基于关键词的预设权重,所以提高了检测粒度。

    文本处理方法、装置及服务器

    公开(公告)号:CN106897422A

    公开(公告)日:2017-06-27

    申请号:CN201710102950.9

    申请日:2017-02-23

    CPC classification number: G06F17/30684 G06F17/2765

    Abstract: 本申请公开了文本处理方法、装置及服务器。该方法的一具体实施方式包括:查询目标文件的文本信息;通过预置的敏感词集合对文本信息进行筛选,确定文本信息中的敏感词;对所确定的敏感词进行文字扩展,生成敏感词的联想词,其中,联想词中包括了敏感词中的文字;将联想词中除敏感词中的文字之外的文字与文本信息进行文字对比,并根据对比结果对文本信息进行处理。该实施方式提高了对文本信息审核的准确性。

Patent Agency Ranking