视频分析方法及相关系统
    11.
    发明公开

    公开(公告)号:CN115292546A

    公开(公告)日:2022-11-04

    申请号:CN202111088882.8

    申请日:2021-09-16

    Abstract: 本申请提供了一种视频分析方法,应用于人工智能(AI)领域,包括:获取视频分析策略,视频分析策略根据地理区域中发生的历史事件的挖掘结果获得,该视频分析策略包括地理区域中需要进行视频分析的目标时段和目标区域,然后根据视频分析策略获取目标视频数据,对目标视频数据进行分析,获得分析结果。该方法基于地理区域中历史事件的发生规律,预测在目标时段内事件发生概率大的目标区域,对目标区域在目标时段的视频数据进行重点分析,实现了AI能力的合理分配,减少了时间维度和空间维度的感知盲区,实现了高效的区域监管。

    一种数据切分方法及相关装置
    12.
    发明公开

    公开(公告)号:CN116796356A

    公开(公告)日:2023-09-22

    申请号:CN202210223293.4

    申请日:2022-03-07

    Abstract: 本申请公开了一种数据切分方法及相关装置,用于在数据标注场景下,实现关于隐私数据的切分,减少单一数据切片中的隐私信息,降低数据隐私泄露的风险。本申请通过根据目标关联关系切分待标注数据,使得每个目标数据切片中的子数据不存在目标关联关系;当存在该目标关联关系的子数据的共同披露会导致隐私泄露的风险时,采用本申请的数据切分方法可以降低数据标注时的数据隐私泄露风险,有效保护数据隐私。

    一种语料标注方法、装置及相关设备

    公开(公告)号:CN115249018A

    公开(公告)日:2022-10-28

    申请号:CN202111582918.8

    申请日:2021-12-22

    Abstract: 本申请提供了一种语料标注方法,语料标注装置获取用户通过客户端提供的语料集合,该语料集合包括用户期望被标注的多种语义类别的语料,并确定语料集合中属于目标语义类别的人工标注语料以及自动标注语料,并获取针对该人工标注语料的人工标注结果,从而根据该人工标注语料的人工标注结果,对自动标注语料进行自动标注,该人工标注结果以及自动标注语料对应的自动标注结果用于作为训练数据对推理模型进行训练。如此,通过对部分语料进行自动标注,可以提高生成标注语料的效率、降低人力成本,同时,领域专家可以仅需对每一语义类别下的少量语料进行人工标注,从而可以减少人工标注的语料数量。此外,本申请还提供了对应的装置及相关设备。

    远程监督命名实体识别数据的降噪方法及装置

    公开(公告)号:CN114757190A

    公开(公告)日:2022-07-15

    申请号:CN202011564259.0

    申请日:2020-12-25

    Abstract: 本申请实施例提供一种远程监督命名实体识别数据的降噪方法及装置,涉及自然语言处理领域,能够提升降噪性能。该方法包括:获取多个标注语料集以及该多个标注语料集各自的总体噪声率,一个标注语料集包含多个标注语料,该多个标注语料是对多个语料进行命名实体标注得到的结果;然后将该多个标注语料集作为训练集,基于该多个标注语料集各自的总体噪声率,训练得到目标神经网络模型;并基于目标神经网络模型,确定第一标注语料集包含的多个标注语料的置信度;以及根据第一标注语料集包含的多个标注语料的置信度以及第一标注语料集的总体噪声率,确定第一标注语料集中的噪声语料,并且删除第一标注语料集中的噪声语料。

    一种分词方法及其相关设备
    16.
    发明公开

    公开(公告)号:CN115700584A

    公开(公告)日:2023-02-07

    申请号:CN202110838414.1

    申请日:2021-07-23

    Abstract: 本申请实施例公开了一种分词方法及其相关设备,涉及自然语言处理领域。该方法包括获取分词策略,分词策略包括构词方式信息。根据构词方式信息,对已标注语料进行筛选,获得目标已标注语料。其中,每个目标已标注语料均携带有对应的标注信息。根据目标已标注语料对目标分词模型进行训练。利用训练后的目标分词模型对语言文本数据进行分词处理。利用上述方法,可以根据用户偏好的分词策略来获取目标分词模型,一方面可以减少标注语料资源的浪费,另一方面可以获得满足用户个性化需求的自定义分词模型,提高了分词效率。

Patent Agency Ranking