-
公开(公告)号:CN102637182A
公开(公告)日:2012-08-15
申请号:CN201110038103.3
申请日:2011-02-15
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种Web社会网络核心用户信息交互演化分析方法包括:1)从Web社会网络应用程序获取用户互动信息数据;2)确定核心用户节点;3)根据获取的数据通过增量计算方法建立Web社会应用网络图结构;4)计算所有图结构中核心节点与其他节点之间的hop距离;5)获取到核心节点的hop距离在阈值内的所有节点,根据节点间的hop距离,将阈值内的节点划分为不同群落;6)根据每个群落的权值,计算出当前时间点与核心节点信息交互最密集的群落;7)预测下一时间点与核心节点信息交互的群落。本发明从核心用户节点入手获得信息在不同节点和群落间的传播规律,并通过增量计算使普通计算机也能进行本发明的图结构分析。
-
公开(公告)号:CN117271803A
公开(公告)日:2023-12-22
申请号:CN202311543548.6
申请日:2023-11-20
Applicant: 北京大学 , 国网信息通信产业集团有限公司 , 国网甘肃省电力公司白银供电公司
Abstract: 本公开提供了一种知识图谱补全模型的训练方法、装置、设备及存储介质,包括:获取每个三元组数据的头实体及尾实体,得到第一实体集合;将每个头实体和尾实体作为第一初始尾实体,获取各类模态对应的第一模态特征向量;将第一初始尾实体包括的至少一类模态中的任一分别作为目标类模态,根据其对应的第一模态特征向量与预设的第一输入数据输入至初始知识图谱补全模型,进而确定目标类模态对应的初始损失函数;对每类模态对应的初始损失函数进行加和处理,得到损失函数,确定其收敛至损失阈值得到知识图谱补全模型。本公开通过对不同模态进行单独训练得到对应的初始损失函数,减小了不同模态间的相互干扰,提高了知识图谱补全的准确率。
-
公开(公告)号:CN117112790A
公开(公告)日:2023-11-24
申请号:CN202311123144.1
申请日:2023-09-01
Applicant: 北京大学(青岛)计算社会科学研究院
IPC: G06F16/35 , G06F40/30 , G06F18/213 , G06F18/214 , G06F18/22 , G06N3/045 , G06N3/0985
Abstract: 本发明提出了一种基于方面语义增强的文本情感分类方法及系统,属于信息技术领域,针对低资源环境方面语义学习不充分的情况,首先从社交媒体采集文本数据,利用元学习设置构建元测试任务和元训练任务。通过大规模语言模型从数据集中提取特征向量,然后构建原型并计算查询样本的语义增强对比损失。利用多头注意力机制生成情感特征向量,并构建交叉熵损失函数。结合两个损失函数进行模型训练,最后预测目标方面的情感极性。本发明在元学习范式中增强方面语义感知能力,提高小样本文本情感分类的准确率,提升目标方面的情感极性判定效果。
-
公开(公告)号:CN111428744A
公开(公告)日:2020-07-17
申请号:CN201910022868.4
申请日:2019-01-10
Applicant: 北京大学 , 国网信息通信产业集团有限公司 , 国家电网有限公司 , 国网浙江省电力有限公司
Abstract: 本发明公开一种保留类型序列信息的异构信息网络表示学习方法和系统。本发明提出了一种保留类型序列的异构信息网络表示学习模型,该模型是一个以type-aware GRU为门控单元并具有衰减函数的新型encoder-decoder框架,可将异构信息网络映射到低维空间中。其通过type-aware GRU结合类型和序列信息,并利用衰减函数保留有代表性的序列信息,将异构信息网络的表示学习扩展到序列级别。本发明可支持将异构信息网络映射到低维空间中,从而便于社交网络等异构信息网络数据的分类、聚类、可视化等各种网络分析应用。
-
公开(公告)号:CN109711913A
公开(公告)日:2019-05-03
申请号:CN201711012697.4
申请日:2017-10-25
Applicant: 中国电力科学研究院有限公司 , 北京大学 , 国家电网公司 , 国网江苏省电力公司电力科学研究院
Abstract: 本发明涉及一种电动汽车供需差预测方法和充电桩布局规划方法。该电动汽车供需差预测方法包括:从原始数据中抽取相关数据并构造特征;使用信息增益率对特征进行排序,生成特征排序表;对特征排序表进行倒序筛选,生成不同数据缺失程度的特征子集;针对不同数据缺失程度的特征子集,利用改进的回归树算法生成相应的子回归树模型;按照线性回归模型进行整合,学习出各个子回归树模型的参数;使用线性回归的投票策略进行集成,得到集成学习回归树模型,进行车辆供需差的预测。然后依据车辆供需差来计算出充电桩布局模型。本发明采用时间复杂度较低、准确率较高的集成学习回归树,能够解决存在数据缺失情况下充电桩布局规划的问题。
-
公开(公告)号:CN103488637B
公开(公告)日:2016-12-14
申请号:CN201210191968.8
申请日:2012-06-11
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明提供一种基于动态社区挖掘进行专家检索的方法,针对动态网络环境,同时利用链接结构和内容信息挖掘社区,将链接结构和内容表达为矩阵形式,综合历史社区划分结果,使用非负矩阵分解方法进行社区划分,并对社区划分代价进行迭代处理,使其结果局部最优化,以使社区结果在反映网络的链接特征的同时,还反映话题、兴趣等语义层面的特征,通过利用社区划分结果和社区话题,进行专家搜索,从而实现不同时刻的专家检索。本发明的方法不仅能反映社区成员、规模的变化,还能反映社区的话题分布及其随时间的变化,从而可以将社区挖掘结果直接专家搜索。
-
公开(公告)号:CN103488638B
公开(公告)日:2016-12-07
申请号:CN201210191976.2
申请日:2012-06-11
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种结果缓存替换的优化方法,属于计算机网络技术领域。本方法为:1)以系统搜索日志中的用户ID为键、用户发起的请求为键值建立一哈希表h2;2)将同一用户ID发起的所有请求进行拼接,得到一字符串,对所有用户的拼接字符串构成的文档集进行话题模型分析,获得话题集合M及关联度;3)计算与某话题相关的搜索请求出现次数与同一时间段内所有请求出现次数的比值,计算该请求的权重贡献值;4)当收到一请求q时,查找匹配的结果缓存并返回和更新h2;如果没有,则在h2中查找对应的键值并与q拼接,计算q的权重贡献值;5)将结果缓存中权重较低的结果项替换出去,并加入新的缓存项。本发明可大大提高缓存命中率的效果。
-
公开(公告)号:CN102637182B
公开(公告)日:2014-05-28
申请号:CN201110038103.3
申请日:2011-02-15
Applicant: 北京大学
IPC: G06F17/30
Abstract: 本发明公开了一种Web社会网络核心用户信息交互演化分析方法,包括:1)从Web社会网络应用程序获取用户互动信息数据;2)确定核心用户节点;3)根据获取的数据通过增量计算方法建立Web社会应用网络图结构;4)计算所有图结构中核心节点与其他节点之间的hop距离;5)获取到核心节点的hop距离在阈值内的所有节点,根据节点间的hop距离,将阈值内的节点划分为不同群落;6)根据每个群落的权值,计算出当前时间点与核心节点信息交互最密集的群落;7)预测下一时间点与核心节点信息交互的群落。本发明从核心用户节点入手获得信息在不同节点和群落间的传播规律,并通过增量计算使普通计算机也能进行本发明的图结构分析。
-
公开(公告)号:CN115964486A
公开(公告)日:2023-04-14
申请号:CN202211512635.0
申请日:2022-11-28
Applicant: 北京大学(青岛)计算社会科学研究院 , 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司
Abstract: 本发明公开了一种基于数据增强的小样本意图识别方法,其步骤包括:1)获取用户意图识别数据集,并对其中每一条用户查询语句标注其意图,作为一样本,得到小样本意图识别数据集;构建小样本意图识别数据集的元任务;2)将小样本意图识别数据集输入自然语言推断生成模型,生成样本的扩展样本并构建扩展元任务;3)根据每一样本所属元任务的样本集,将每一样本映射到特征空间中,得到样本在对应元任务中的特征向量;4)将每一样本在各元任务中的特征向量融合作为该样本的最终向量;5)利用各样本的最终向量训练原型网络,将训练后的原型网络作为样本意图识别模型;6)使用小样本意图识别模型对输入的查询语句进行预测,得到该查询语句的意图。
-
公开(公告)号:CN115840824A
公开(公告)日:2023-03-24
申请号:CN202211514641.X
申请日:2022-11-29
Applicant: 海尔优家智能科技(北京)有限公司 , 北京大学(青岛)计算社会科学研究院 , 青岛海尔科技有限公司
IPC: G06F16/36 , G06F16/35 , G06F40/211 , G06F40/30 , G06F16/33 , G06N3/08 , G06N3/0464
Abstract: 本发明提供一种面向环境信息扩增的智能家居用户口语理解系统,本系统将数据集按照意图域划分并存储源域、目标域数据文件;在源域、目标域上通过采样进行训练、测试任务构建;提取文本、环境信息并规范化组织、填充、拼接;提取意图、槽位信息并构建意图、槽位词典表;使用预训练语言模型、图卷积网络、标签注意力层与互注意力层实现文本、环境信息编码;使用注意力机制及环境信息与意图、槽位标签的文本语义信息相似性矩阵实现用户话语文本信息与域间通用、域间扩增的环境信息的融合;在源域、目标域上使用支持集、查询集进行少样本训练与测试;将向量编码的意图、槽位类别转化为可视化文本输出。本发明提供融合环境信息的用户口语理解解决方案。
-
-
-
-
-
-
-
-
-