-
公开(公告)号:CN112602074A
公开(公告)日:2021-04-02
申请号:CN201980055926.1
申请日:2019-06-25
Applicant: 微软技术许可有限责任公司
Abstract: 本文描述了一种用于利用数据流分析来执行关于源数据集和所生成的导出数据集的数据分类的系统和方法。根据所执行的动作和导出数据集,使用自适应算法来计算字段的流置信度。根据相关联的置信度和流置信度来计算针对特定标签的相关联的导出置信度。当相关联的导出置信度大于或等于第一阈值时,将特定标签复制到导出数据集。在一些实施例中,当相关联的导出置信度小于或等于第二阈值时,不将特定标签复制到导出数据集。否则,要采取的动作被标识。接收对该动作的响应,并且根据所接收的响应来修改自适应算法。
-
公开(公告)号:CN112602074B
公开(公告)日:2024-07-26
申请号:CN201980055926.1
申请日:2019-06-25
Applicant: 微软技术许可有限责任公司
IPC: G06F18/241 , G06F16/25 , G06F16/23
Abstract: 本文描述了一种用于利用数据流分析来执行关于源数据集和所生成的导出数据集的数据分类的系统和方法。根据所执行的动作和导出数据集,使用自适应算法来计算字段的流置信度。根据相关联的置信度和流置信度来计算针对特定标签的相关联的导出置信度。当相关联的导出置信度大于或等于第一阈值时,将特定标签复制到导出数据集。在一些实施例中,当相关联的导出置信度小于或等于第二阈值时,不将特定标签复制到导出数据集。否则,要采取的动作被标识。接收对该动作的响应,并且根据所接收的响应来修改自适应算法。
-
公开(公告)号:CN116964570A
公开(公告)日:2023-10-27
申请号:CN202180093607.7
申请日:2021-10-28
Applicant: 微软技术许可有限责任公司
IPC: G06F16/21
Abstract: 描述了用于出处信息从数据库查询执行日志中的高效提取的系统、方法和设备。从一个或多个数据库查询执行日志中提取的事件记录集合被接收。相关事件记录的群被标识,并且每个群被定义为一活动。对于每个活动,活动数据结构是基于相关联的事件记录来生成的。活动结构对该活动的查询执行依赖性进行编码。对于每个活动,通过基于相关联的事件记录和活动数据结构来标识和实例化过程实体和关系来提取运行时信息。对于每个活动,通过基于相关联的事件记录内的查询文本来标识和实例化数据集实体及其沿袭关系来提取沿袭信息。沿袭信息针对每个活动被映射到运行时信息,以生成和存储出处数据模型以供一个或多个出处应用使用。
-
-