-
公开(公告)号:CN107977678A
公开(公告)日:2018-05-01
申请号:CN201711212965.7
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
Abstract: 本申请公开了用于输出信息的方法和装置。该方法的一具体实施方式包括:从目标资讯网站获取资讯数据集合;确定资讯数据集合中的每条资讯数据所属的领域;对于每个领域,将资讯数据集合中属于该领域的资讯数据进行聚类分析,得到每个聚类簇中资讯数据的数量和聚类中心;对于每个领域的每个聚类簇,将该聚类簇中的聚类中心作为该领域的热点资讯,将属于该聚类簇中资讯数据的数量作为该热点资讯的资讯热度进行输出。该实施方式能够提高领域识别的准确度并提高识别热点资讯的速度。
-
公开(公告)号:CN107832305A
公开(公告)日:2018-03-23
申请号:CN201711214477.X
申请日:2017-11-28
Applicant: 百度在线网络技术(北京)有限公司
IPC: G06F17/27
CPC classification number: G06F17/2775 , G06F17/2785
Abstract: 本申请实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:根据目标关键词获取待分析信息;将待分析信息输入预先建立的情感分析模型,生成待分析信息的情感倾向信息,情感分析模型是通过以下训练步骤得到的:获取无标签样本数据和有标签样本数据;使用预先建立的标签生成模型生成无标签样本数据对应的标签信息,将无标签样本数据和生成的标签信息作为扩展样本数据,标签生成模型用于表征无标签样本数据与标签信息之间的对应关系;使用有标签样本数据和扩展样本数据训练得到情感分析模型。该实施方式自动生成扩展样本数据,扩大了样本集数据,减少了人工标注的成本,提高了情感分析模型生成的信息准确性。
-