基于互联网日志数据的软件缺陷故障识别方法和系统

    公开(公告)号:CN105653444A

    公开(公告)日:2016-06-08

    申请号:CN201510977321.1

    申请日:2015-12-23

    Applicant: 北京大学

    Inventor: 李影 贾统 吴中海

    CPC classification number: G06F11/3692

    Abstract: 本发明公布了一种基于互联网日志数据的软件缺陷故障识别方法和系统,针对互联网源系统日志数据和用户系统源日志数据,将互联网源系统日志数据作为训练集并从中提取特征,通过机器学习或相似度匹配生成软件缺陷故障日志识别预测模型;针对用户系统源日志数据,分析识别得到其中表征软件缺陷故障的日志片段,从而得到针对用户系统日志的软件缺陷故障类型。云计算系统故障识别系统包括多线日志收集模块、互联网源系统日志分类器和在线日志分析与故障识别模块。本发明可实现从大量日志信息识别由软件缺陷导致的故障,快速定位故障原因,识别运行时故障并诊断故障类型,提高云计算系统的可靠性和可用性。

    一种无损的调用链压缩还原方法与系统

    公开(公告)号:CN117406929B

    公开(公告)日:2024-06-07

    申请号:CN202311490414.2

    申请日:2023-11-09

    Applicant: 北京大学

    Abstract: 本发明公开了一种无损的调用链压缩还原方法与系统,属于云计算技术领域。本发明基于分布式追踪技术获取分布式软件系统中的原始调用链,然后将原始调用链预处理转化为以有序树表示的调用链,进而在大量的调用链中挖掘频繁子树,并按照最大频繁子树的前序遍历顺序序列化该频繁子树上所有Span的属性信息,从而可以根据挖掘到的共性结构对预处理后的原始调用链进行简化表示,如需获取压缩后的调用链对应的原始调用链,则根据挖掘出的共性结构将调用链中被压缩的部分进行还原。本发明在全量保存所有服务请求的完整的调用链的基础上,降低分布式软件系统海量的服务请求引起的巨大的调用链存储开销,提升系统运行的整体性能。

    一种无损的调用链压缩还原方法与系统

    公开(公告)号:CN117406929A

    公开(公告)日:2024-01-16

    申请号:CN202311490414.2

    申请日:2023-11-09

    Applicant: 北京大学

    Abstract: 本发明公开了一种无损的调用链压缩还原方法与系统,属于云计算技术领域。本发明基于分布式追踪技术获取分布式软件系统中的原始调用链,然后将原始调用链预处理转化为以有序树表示的调用链,进而在大量的调用链中挖掘频繁子树,并按照最大频繁子树的前序遍历顺序序列化该频繁子树上所有Span的属性信息,从而可以根据挖掘到的共性结构对预处理后的原始调用链进行简化表示,如需获取压缩后的调用链对应的原始调用链,则根据挖掘出的共性结构将调用链中被压缩的部分进行还原。本发明在全量保存所有服务请求的完整的调用链的基础上,降低分布式软件系统海量的服务请求引起的巨大的调用链存储开销,提升系统运行的整体性能。

    一种基于生成式大模型的软件系统配置生成方法与系统

    公开(公告)号:CN116932037A

    公开(公告)日:2023-10-24

    申请号:CN202311002875.0

    申请日:2023-08-10

    Applicant: 北京大学

    Abstract: 本发明提供了一种基于生成式大模型的软件系统配置生成方法与系统,属于软件技术领域。本发明基于生成式大模型,收集多源系统配置数据,根据配置数据与目标软件系统配置数据的相似度进行适配得到微调数据集,使用微调数据集对生成式大模型进行微调,应用多目标提示工程接收来自用户的原配置文本、配置目标文本数据及配置示例集合,生成多目标提示文本作为生成式大模型的输入,模型输出得到候选配置,最后通过配置筛选,用户从输出的多个候选配置中筛选满足配置目标的有效配置作为最终结果,或将其返回用于多目标提示文本的优化,进一步提升多目标提示文本的质量和配置生成的有效性。

    一种数联网上数据高效分发方法与装置

    公开(公告)号:CN115623000A

    公开(公告)日:2023-01-17

    申请号:CN202211194855.3

    申请日:2022-09-29

    Applicant: 北京大学

    Abstract: 本申请实施例提供了一种数联网上数据高效分发方法与装置,包括:通过本地客户端执行规划算法,从所有数联网其他节点中选取至少部分目标节点构建为树状结构的节点拓扑集合;在本地客户端,根据传输树结构生成树状网络规划文件,并与将要分发的目标数据文件打包上传至传输树根节点,依靠树状网络的传输关系将上述数据包分发至数联网中的所有节点;依靠建立树状传输树向数联网所有节点实行数据分发,能够大幅提高数联网节点之间的信息传输效率。

    一种基于耦合度的微服务在线分配方法与系统

    公开(公告)号:CN112148484A

    公开(公告)日:2020-12-29

    申请号:CN202010960107.6

    申请日:2020-09-14

    Applicant: 北京大学

    Abstract: 本发明公布了一种基于耦合度的微服务在线分配方法与系统,通过计算微服务之间的耦合度,对所有微服务进行分组,并将同一组内的微服务分配到同一个硬件节点上,降低网络通信开销,缩短请求响应时间,实现基于微服务架构的系统中微服务在线分配的优化;包括获取请求执行路径与资源监控数据、根据请求执行路径计算微服务之间的耦合度、基于耦合度将微服务划分为不同的微服务分组MicroServPod、基于微服务之间的资源竞争关系将微服务分组划分为微服务细分组SubMicroServPod、根据每个SubMicroServPod的资源消耗总量将SubMicroServPod在线分配到硬件节点上,实现基于微服务架构的系统中微服务在线分配的优化,缩短服务请求的响应时间,提高服务效率,提升系统运行性能。

    电影上座率预测方法和系统

    公开(公告)号:CN106127333A

    公开(公告)日:2016-11-16

    申请号:CN201610450944.8

    申请日:2016-06-21

    Applicant: 北京大学

    CPC classification number: G06Q10/04 G06N5/025

    Abstract: 本发明公布了一种电影上座率预测方法及其系统,包括离线模型训练阶段与在线上座率预测阶段,根据已上映影片信息得到数据集,基于机器学习方法训练得到上座率预测模型,再利用模型预测得到待预测影片的上座率预测值。系统包括预测模型训练模块和上座率预测模块;训练模块包括电影上座率特征提取器和电影上座率预测模型训练器,用于提取训练特征生成数据集,得到预测模型;预测模块包括预处理器和预测模型;对数据进行预处理得到待预测影片数据,输入到预测模型计算得到预测值。本发明实现对电影上座率进行自动预测,可作为电影发行阶段的重要商业智能参考,帮助提高电影票房收入并节省资源。

    基于移动用户时空行为的云应用可用性预测方法与系统

    公开(公告)号:CN104468257A

    公开(公告)日:2015-03-25

    申请号:CN201410598622.9

    申请日:2014-10-30

    Applicant: 北京大学

    Abstract: 本发明公开了一种基于移动用户时空行为的云应用可用性预测方法与系统。本方法为:1)移动智能设备端将用户选取的待预测云应用及其使用时间t,即用户使用模式,发送给该移动智能设备端的移动用户时空行为数据收集器;2)所述移动用户时空行为数据收集器将收到的用户使用模式信息,该移动智能设备端的电量消耗统计信息以及网络状态模式统计信息发送给云端;3)所述云端根据该移动用户时空行为数据收集器发送过来的数据计算所述待预测云应用在设定使用时间段的可用性,并将计算结果发送给该移动智能设备端。本发明可帮助用户预测未来时间段其移动设备上云应用的可用性,为用户应用提供方便;同时,也帮助移动云应用提供商或服务商优化服务。

    一种基于多层次跨模态差异调和的多模态行人重识别方法

    公开(公告)号:CN116682144A

    公开(公告)日:2023-09-01

    申请号:CN202310732993.0

    申请日:2023-06-20

    Applicant: 北京大学

    Abstract: 本发明提供了一种基于多层次跨模态差异调和的多模态行人重识别方法,属于计算机视觉领域。本发明包括训练样本的获取,以及行人图片和相应文本描述的预处理;然后使用模态编码器‑模态共享解码器架构,在一组可学习的语义查询嵌入的引导下,提取出模态对齐的视觉和文本特征;再使用全局文本特征和未掩码图像块作为输入,对掩码图像块重建,调和图像块级别和实例级别的跨模态差异;通过交叉身份双模拟学习,利用一个差异预测器,帮助不同身份行人特征间的相关性在不同模态间转换,缓解身份级别的跨模态差异;最后使用模型输出的模态对齐的视觉特征和文本特征,计算查询文本特征和图像库中图像特征之间的相似度矩阵,实现准确高效的行人重识别。

    计算机系统日志模板的自动生成和在线更新方法与系统

    公开(公告)号:CN111435343B

    公开(公告)日:2023-02-24

    申请号:CN201910035072.2

    申请日:2019-01-15

    Applicant: 北京大学

    Abstract: 本发明公布了一种计算机系统日志模板的自动生成和在线更新方法及系统,包括离线挖掘阶段和在线更新阶段;离线挖掘阶段采用分组聚类方法,从给定日志数据集合中挖掘得到日志模板列表;在线更新阶段基于新采集的日志进行逐条分析,实现对现有日志模板自动更新。系统包括:日志预处理模块、日志分组组件、模板处理组件、模板跨组整合组件、模板匹配组件、模板更新组件。本发明不依赖特定的数据内容和格式,具有很强的泛化能力;可实现对系统日志数据集的自动化分析,生成日志模板,并能针对新采集的日志,提取数据特征,实现日志模板的自动化更新,确保日志模板列表的完备性和及时更新,且运行效率高。

Patent Agency Ranking