短文本处理方法及装置
    2.
    发明授权

    公开(公告)号:CN104850617B

    公开(公告)日:2018-04-20

    申请号:CN201510250477.X

    申请日:2015-05-15

    Inventor: 阮星华 张文

    Abstract: 本申请公开了短文本处理方法及装置。所述方法包括:获取第一短文本集合,并对第一短文本集合进行预处理;基于预处理后的第一短文本集合,执行如下处理步骤:使用预处理后的第一短文本集合训练主题模型LDA,得到第一短文本集合中各短文本的主题概率分布;对主题概率分布进行聚类,确定第一短文本集合中各短文本的主题类别。本申请通过训练主题模型并进一步对主题概率分布进行聚类,可以得到短文本的主题类别,实现了对短文本准确分类的目的。

    短文本处理方法及装置
    3.
    发明公开

    公开(公告)号:CN104850617A

    公开(公告)日:2015-08-19

    申请号:CN201510250477.X

    申请日:2015-05-15

    Inventor: 阮星华 张文

    CPC classification number: G06F17/30705 G06F17/30731 G06K9/6218 G06K9/6297

    Abstract: 本申请公开了短文本处理方法及装置。所述方法包括:获取第一短文本集合,并对第一短文本集合进行预处理;基于预处理后的第一短文本集合,执行如下处理步骤:使用预处理后的第一短文本集合训练主题模型LDA,得到第一短文本集合中各短文本的主题概率分布;对主题概率分布进行聚类,确定第一短文本集合中各短文本的主题类别。本申请通过训练主题模型并进一步对主题概率分布进行聚类,可以得到短文本的主题类别,实现了对短文本准确分类的目的。

    判定网页质量的方法及系统

    公开(公告)号:CN104462284A

    公开(公告)日:2015-03-25

    申请号:CN201410697438.X

    申请日:2014-11-27

    CPC classification number: G06F9/451

    Abstract: 本发明提供一种判定网页质量的方法及系统,所述方法包括:通过动态扫描对浮层进行识别以及通过静态扫描对弹框进行识别;提取所述识别出的浮层及弹框的布局参数以及文字内容;根据所述提取出的布局参数以及文字内容,判定出所述网页的质量。通过采用本发明可以动态识别出网页中的浮层,从而能够提高判定异步网页质量的准确率。

    判定网页质量的方法及系统

    公开(公告)号:CN104462284B

    公开(公告)日:2018-04-13

    申请号:CN201410697438.X

    申请日:2014-11-27

    Abstract: 本发明提供一种判定网页质量的方法及系统,所述方法包括:通过动态扫描对浮层进行识别以及通过静态扫描对弹框进行识别;提取所述识别出的浮层及弹框的布局参数以及文字内容;根据所述提取出的布局参数以及文字内容,判定出所述网页的质量。通过采用本发明可以动态识别出网页中的浮层,从而能够提高判定异步网页质量的准确率。

    一种音频处理方法及装置

    公开(公告)号:CN104104793A

    公开(公告)日:2014-10-15

    申请号:CN201410306002.3

    申请日:2014-06-30

    Inventor: 阮星华 张文

    Abstract: 本发明实施例提供了一种音频处理方法,包括:接收终端发送的音频控制信息;依据变音参数和所述音频控制信息,获得第一音频信息;播放所述第一音频信息;本发明实施例还提供一种音频处理装置。根据本发明实施例提供的技术方案,可以实现依据终端的控制进行音频处理,提高播放音频的多样性。

Patent Agency Ranking