一种长文本到短文本的迁移学习方法

    公开(公告)号:CN103324708B

    公开(公告)日:2016-06-29

    申请号:CN201310241428.0

    申请日:2013-06-18

    Abstract: 本发明涉及一种长文本到短文本的迁移学习方法,其特征在于:步骤1:根据目标领域短文本中提取的标签,通过搜索引擎获得源领域数据,提取源领域的种子特征集;步骤2:根据目标领域短文本的标签集和源领域的种子特征集,构建社交媒体无向图,从无向图中提取包含所有目标领域标签集和种子特征集节点的子图;步骤3:基于拉普拉斯特征映射算法,获得源领域数据新的特征表示;步骤:4:根据源领域数据新的特征表示,对源领域数据进行分类。

    一种通用的自主数据采集方法

    公开(公告)号:CN101221564A

    公开(公告)日:2008-07-16

    申请号:CN200710072606.6

    申请日:2007-08-03

    Abstract: 本发明提供的是一种通用的自主数据采集方法。包括(1)创建核心数据库表采集库配置信息与采集库详细信息;(2)管理部门设置采集库结构;(3)为采集库生成采集模板;(4)为采集库创建Web模板;(5)为采集库创建Word模板。采用了本发明所述的方法后,管理部门只需要通过应用程序接口自主设置各类采集数据的结构,各类采集需要的Excel模板、Word模板与Web模板,就可自行采集数据,而不需要重新开发一套新的采集软件来实现预期的功能。

    一种基于用户身份关联的多源社交网络构建方法

    公开(公告)号:CN111815468B

    公开(公告)日:2023-05-09

    申请号:CN202010498851.9

    申请日:2020-06-04

    Abstract: 本发明的一种基于用户身份关联的多源社交网络构建方法,属于社交网络分析技术领域。首先定义伪超边的概念并构造伪超边超图模型,通过引入拓扑亲密值度量超图中节点间拓扑结构相似性,然后将超图中节点的用户名属性向量化进行相似度计算,进而提出基于联合锁定策略的用户身份关联方法实现跨社交网络用户匹配,最后基于用户匹配结果进行社交关系填补完成多源社交网络构建。本发明提出的基于用户身份关联的多源社交网络的构建方法最大化利用网络拓扑信息,综合利用结构特性和用户属性进行用户匹配,克服单一网络的局限性,构建的网络更加完备、精准,在种子节点有限的情况下也能获得较好地效果。

    一种基于随机风场和海浪的船舶倾覆风险测试方法

    公开(公告)号:CN110937082B

    公开(公告)日:2021-11-09

    申请号:CN201911192235.4

    申请日:2019-11-28

    Abstract: 本发明属于船舶倾覆仿真测试技术领域,具体涉及一种基于随机风场和海浪的船舶倾覆风险测试方法。本发明采用改进的随机风场和海浪的同频叠加模拟算法,该方法在选取频率区间时,将随机风与海浪同时考虑,忽略低频与高频,集中选取风谱与海浪谱的同频部分。为得到具有随机性的风和海浪模拟结果,在选取离散点时,采用两次随机过程选取离散区间与离散点,从而使算法输出具有随机性与准确性的模拟结果。本发明采用改进的恢复力臂计算模型,将时间与侧倾角引入恢复力臂的计算,使恢复力臂值随时间与侧倾角变化,大幅度提高力臂的精确度,从而精确计算船舶发生倾覆的时间。

    一种基于多特征融合的商品评论情感分析方法

    公开(公告)号:CN112861541A

    公开(公告)日:2021-05-28

    申请号:CN202011476049.6

    申请日:2020-12-15

    Abstract: 本发明提供了一种基于多特征融合的商品评论情感分析方法。对数据集进行噪音过滤,进行文本的分词、词性筛选,统计词频,得到预处理后的文本;对文本中的词语使用word2Vec进行词向量表示;使用基于词语共现度的方法,结合凝聚层次聚类算法挖掘商品评论中的有关属性的情感词;针对描述商品属性的情感词进行情感词典扩充,确定新词的情感倾向;将否定词典、连词词典、程度词典等文本特征、用户特征、商品特征进行多特征进行有机融合来确定文本的情感倾向,以此构建半监督训练集;根据构建的训练集,对文本进行基于SVM的情感分类。本发明提出的基于多特征融合的情感分类方法能够有效提高分类的准确度,在产品跟踪、服务反馈、意见挖掘以及舆情监控等方面有着重要的应用价值。

    一种基于情感分析和标签的微博在线突发事件检测方法

    公开(公告)号:CN106547875B

    公开(公告)日:2020-05-15

    申请号:CN201610945406.6

    申请日:2016-11-02

    Abstract: 本发明属于网络检测领域,具体涉及一种基于情感分析和标签的微博在线突发事件检测方法。本发明包括:使用情感分类模型情感轮,构造情感分析模型——情感同现图;使用步骤(1)构造的情感分析模型,对微博流中的微博进行情感分类,采用kleinberg算法检测微博流的突发期;提取突发期内的微博标签,过滤掉垃圾标签,对剩余标签进行分词处理;形成事件的初始关键词;利用步骤(3)生成的关键词,提取微博中与此关键词相关的词,形成事件的最终描述。本发明构造基于情感轮的情感同现图,情感分类更加细致,情感更容易理解和解释,相对于基于情感符号的事件检测准确率更高。

    用户行为与心理学的社会网络影响力最大化方法

    公开(公告)号:CN110766126A

    公开(公告)日:2020-02-07

    申请号:CN201910975774.9

    申请日:2019-10-15

    Inventor: 杨静 张薇

    Abstract: 本发明公开了用户行为与心理学的社会网络影响力最大化方法,属于数据挖掘领域与社会网络科学领域。该方法在社交网络中,首先采用基于IC方法的启发式算法,通过用户活动时间识别非活跃用户群,将其从采样空间中删除,完成粒子群的初始化。这样的初始化方法可以缩短初始状态与种子用户集合之间的差距,加速算法收敛,提高准确度。其次,根据二度理论以及得寸进尺效应构建目标优化函数,估算用户的影响力,减小候选用户之间的影响力重叠影响,提高准确率。最后,结合目标函数以及IC方法构建局部寻优算法,对粒子群速度,位置,加速收敛,得到种子用户集合,实现影响力最大化。

    一种基于话题影响力的微博话题溯源方法

    公开(公告)号:CN104133897B

    公开(公告)日:2017-07-11

    申请号:CN201410374437.1

    申请日:2014-08-01

    Abstract: 本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法。本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头。本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效。

Patent Agency Ranking