基于微博社交网络的话题自动推荐方法及其系统

    公开(公告)号:CN105447179B

    公开(公告)日:2019-02-05

    申请号:CN201510924866.6

    申请日:2015-12-14

    Applicant: 清华大学

    Inventor: 徐华 李佳

    Abstract: 本发明公开了一种基于微博社交网络的话题自动推荐方法及其系统,方法包括:对每条微博内容进行预处理;使用增量双词主题模型对预处理后的文字内容进行主题预测,得到每条微博对应的主题;根据用户的历史微博数据对应的主题建立相应的隐含狄利克雷分布模型;根据隐含狄利克雷分布模型挖掘用户的兴趣分布;从新发布的微博内容中抽取预设数量的微博内容重新挖掘用户的兴趣分布,并删除发布最早的微博内容;根据用户的兴趣分布向用户推荐相应内容。本发明具有如下优点:对微博社交网络平台用户发送的新微博自动推荐合适的话题。话题不仅可以帮助用户和微博平台对海量微博内容进行管理,也能在很多自然语言处理应用场景下提高现有系统的准确性。

    基于微博文本的微博用户兴趣发现方法及系统

    公开(公告)号:CN103970866B

    公开(公告)日:2017-11-21

    申请号:CN201410194170.8

    申请日:2014-05-08

    Applicant: 清华大学

    Inventor: 徐华 杨炜炜 王玮

    Abstract: 本发明提出一种基于微博文本的微博用户兴趣发现方法,包括以下步骤:从互联网上获取数据信息,其中,数据信息包括微博文本、转发信息和关注信息;对微博文本进行分析以获取先验知识,其中,先验知识包括用户互动关系和种子词;对微博文本进行主题聚类以生成主题模型;以及将先验知识集成至主题模型中以对用户的兴趣进行发现。本发明实施例的方法能够快速的从海量微博用户及其文本中发现用户兴趣分布,另外,该方法自适应性好、易于扩展。本发明还提供了一种基于微博文本的微博用户兴趣发现系统。

    面向微博平台话题推荐的评估方法及装置

    公开(公告)号:CN106202574A

    公开(公告)日:2016-12-07

    申请号:CN201610698208.4

    申请日:2016-08-19

    Applicant: 清华大学

    Inventor: 徐华 李佳

    Abstract: 本发明公开了一种面向微博平台话题推荐的评估方法及装置,其中,方法包括以下步骤:从互联网上获取微博平台中多条微博文本;对多条微博文本进行分词;获取分词后的多条微博文本的词频,以得到微博内容;根据微博内容得到无监督话题推荐信息;根据无监督话题推荐信息的词向量与预设的测试集中话题的词向量的欧式距离得到评估结果。本发明实施例的评估方法可以对无监督方法得到的推荐话题进行自动评估,实现对微博平台的无监督话题推荐方法的有效地自动评估检测,从而确定无监督方法的有效性,不仅可以节省人力,且评测结果更具有说服力。

    基于编码-解码深度神经网络的文本摘要生成系统及方法

    公开(公告)号:CN105930314A

    公开(公告)日:2016-09-07

    申请号:CN201610232659.9

    申请日:2016-04-14

    Applicant: 清华大学

    CPC classification number: G06F17/248 G06F17/30867

    Abstract: 本发明公开了一种基于编码‑解码深度神经网络的文本摘要生成系统及方法,系统包括:互联网文本获取模块,用于获取互联网上的文本信息;数据预处理模块,用于对所述文本信息进行预处理;摘要模型训练模块,用于对进行预处理后的文本信息抽取定量文本信息根据编码‑解码深度神经网络模型进行训练,得到摘要训练模型;摘要生成模块,用于根据所述编码‑解码深度神经网络模型对预处理后的文本信息作于出入,输出预设长度的摘要信息。本发明具有如下优点:利用计算机自动分析并提取或生成文本所表述的中心内容,将文本信息压缩为一个简介连贯的摘要文本,方便用户了解文本内容,从而快速阅读和选择感兴趣的信息;摘要能压缩文本,减少用户的浏览负担。

    基于主题模型的微博用户情绪层次化分类方法和分类系统

    公开(公告)号:CN105573983A

    公开(公告)日:2016-05-11

    申请号:CN201510957386.X

    申请日:2015-12-17

    Applicant: 清华大学

    Inventor: 徐华 张帆

    CPC classification number: G06F17/2705

    Abstract: 本发明公开了一种基于主题模型的微博用户情绪层次化分类方法和分类系统,分类方法包括S1:获取微博内容并进行预处理得到待分类词语,其中,所述待分类词语为副词、动词和形容词之中的一种或多种;S2:对所述待分类词语进行特征降维;以及S3:对特征降维后的待分类词语按照层次分类模型进行微博内容的情绪分类,其中,所述层次分类模型中所有层的节点为代表某种情绪的词语。本发明具有如下优点:设计了层次分类框架,并根据微博博文短文本的结构特点,采用了LDA这种概率生成模型来刻画数据进而进行特征降维和抽取。符合文本特点的模块引用提高了分类的准确性,获得了较好的分类结果。

    面向半导体制造设备功能仿真的参数变化规律模拟系统

    公开(公告)号:CN101957879B

    公开(公告)日:2015-12-02

    申请号:CN201010290261.3

    申请日:2010-09-25

    Applicant: 清华大学

    Inventor: 徐华 王巍 李垒

    Abstract: 本发明提出一种面向半导体制造装备功能仿真的运行参数变化规律模拟系统,包括:系统界面接口,PID变化规律模块,所述PID变化规律模块包括保存PID配置参数的结构体,用户自定义变化规律模块,所述用户自定义变化规律模块包括保存用户自定义变化规律的配置参数的结构体,和变化规律线程管理模块,所述变化规律线程管理模块针对一个参数变化规律开启一个线程,并在变化条件满足后自动结束所述线程,以及根据哈希表对所述线程进行管理以开启或结束变化规律线程。本发明具有配置简单、适应性强、贴近实际的特点,而且克服了同一个设备属性参数在不同的变化规律之间进行切换的问题。

    银行后台运维系统的故障预测方法及系统

    公开(公告)号:CN104156562A

    公开(公告)日:2014-11-19

    申请号:CN201410337349.4

    申请日:2014-07-15

    Applicant: 清华大学

    Inventor: 徐华 李晓潇

    Abstract: 本发明提出一种银行后台运维系统的故障预测方法,包括以下步骤:获取银行数据样本,并从银行数据样本中提取初始特征数据;对初始特征数据进行降维以得到最终特征数据;利用随机森林方法对最终特征数据进行分类学习,以便根据分类结果对银行后台运维系统进行故障预测;当预测到银行后台运维系统将要发生故障时,根据最终特征数据调整银行后台运维系统的参数以避免银行后台运维系统发生故障或降低银行后台运维系统的故障发生概率。本发明的方法能够有效地预测银行后台运维系统的故障,并且通过有效防范可避免或降低故障发生的概率。本发明还提供了一种银行后台运维系统的故障预测系统。

    银行后台TPS交易事件趋势预测方法及系统

    公开(公告)号:CN104123592A

    公开(公告)日:2014-10-29

    申请号:CN201410337287.7

    申请日:2014-07-15

    Applicant: 清华大学

    Inventor: 徐华 李晓潇

    Abstract: 本发明提出一种银行后台TPS交易事件趋势预测方法及系统,其中,该方法包括:获取银行后台交易数据,并从银行后台交易数据提取TPS数据及其特征,其中,TPS数据特征指从银行后台交易数据中抽取的多种相关信息链接而形成的每个时刻的特征;选择随机森林模型,并根据TPS数据训练随机森林模型以得到训练完成的TPS交易事件趋势预测回归模型;向TPS交易事件趋势预测回归模型输入测试集数据以进行TPS交易事件趋势预测;以图像化形式显示TPS交易事件趋势预测结果。根据本发明的实施例,不仅能给银行的后台服务改进提供参考,也能对银行故障排除方法的决策给出建议。

    基于微博文本的情绪分类和情绪成分分析方法及系统

    公开(公告)号:CN103970864A

    公开(公告)日:2014-08-06

    申请号:CN201410193638.1

    申请日:2014-05-08

    Applicant: 清华大学

    Inventor: 徐华 杨炜炜 王玮

    CPC classification number: G06F17/30705 G06F17/30731

    Abstract: 本发明公开了一种基于微博文本的情绪分类和情绪成分分析方法,包括以下步骤:从互联网上获取多条用户发布的微博文本;对多条微博文本进行分词,以根据每个词的词性得到多个词;从多个词中提取多个特征词;根据多个特征词训练情绪分类体系中每个节点的分类器,以构建情绪分类体系,并通过情绪分类体系实现情绪分类;根据分类结果对微博文本情绪成分进行分析。本发明实施例的方法,通过提取多个特征词构建情绪分类体系,实现情绪分类,并根据分类结果对微博文本情绪成分进行分析,不但节省了时间,提高了分类速度和分类效果,还能快速分析情绪成分,更好地满足用户的使用需求。本发明还公开了一种基于微博文本的情绪分类和情绪成分分析系统。

Patent Agency Ranking