实体关系抽取方法、装置、数据标注系统以及存储介质

    公开(公告)号:CN115114918A

    公开(公告)日:2022-09-27

    申请号:CN202110286687.X

    申请日:2021-03-17

    Abstract: 本公开提供了一种实体关系抽取方法、装置、数据标注系统以及存储介质,其中的方法包括:使用强化学习模型对词向量以及初始关系子图进行处理,获取词向量中的各个词之间的实体关系抽取信息;基于实体关系抽取信息生成关系子图,使用关系图处理模型对关系子图进行处理,生成与关系子图相对应的关系子图特征信息;基于词向量和关系子图特征信息,生成强化学习模型的状态信息,使用强化学习模型对状态信息进行处理,用以获取新实体关系抽取信息。本公开的方法、装置以及存储介质,将NLP的实体关系生成问题转换为实体关系图的生成问题,能够高效地表征实体关系,降低了人工成本,提高了标注效率。

    异构资源分配方法、装置、电子设备及存储介质

    公开(公告)号:CN114911618A

    公开(公告)日:2022-08-16

    申请号:CN202210516665.2

    申请日:2022-05-12

    Abstract: 本公开提供了一种异构资源分配方法、装置、电子设备及存储介质,涉及计算机技术领域。该方法包括:接收目标用户向异构集群发送的资源分配请求,其中,目标用户为异构集群中当前资源占用率最低的用户,当前资源占用率基于预设性能权重计算获得;响应于资源分配请求,获取目标用户的目标资源需求量,目标资源需求量为目标用户待执行任务的资源需求量;若目标资源需求量小于或等于异构集群中相应类型的空闲资源总量,则随机选择空闲资源并分配至目标用户,以使目标用户获取到满足目标资源需求量的资源。本公开能够根据设备运行的实际性能对集群中的资源进行分配,保证了资源分配的公平性。

    任务处理方法、装置、系统及设备

    公开(公告)号:CN114780214A

    公开(公告)日:2022-07-22

    申请号:CN202210352913.4

    申请日:2022-04-01

    Abstract: 本申请的实施例揭示了一种任务处理方法、装置、系统及电子设备,该方法通过对待处理任务进行任务拆分,得到子任务集合;将子任务集合中的子任务分配给数据集群,以使数据集群处理子任务,得到子任务对应的子任务处理结果,进而不用将各个数据集群的数据进行集中,通过将待处理任务拆分为子任务,将子任务下发至数据集群进行本地计算,使算力下沉至靠近数据的位置;然后基于数据集群反馈的子任务处理结果,得到待处理任务对应的目标任务处理结果,使数据集群只需上传子任务处理结果,然后对各个子任务处理结果汇总即可得到目标任务处理结果,减少了各个数据集群进行数据传输的开销,进而提高了任务完成的效率。

    数据增强方法和装置
    24.
    发明公开

    公开(公告)号:CN114064887A

    公开(公告)日:2022-02-18

    申请号:CN202010789559.2

    申请日:2020-08-07

    Abstract: 本公开涉及数据增强方法和装置。提供了一种用于增强语料库中的数据对象的数据增强方法,包括:针对所述语料库中的至少一部分数据对象中的每个数据对象:将所述数据对象分解成多个词语;计算所述多个词语中的每个词语的重要性得分,所述重要性得分表示该词语是所述数据对象的主题词的概率;基于所述重要性得分,按特定概率对所述多个词语进行抽取,使得所述重要性得分越高的词语被抽取到的概率越小;以及针对抽取到的每个词语进行替换、删除以及插入中的至少一个的处理,从而获得所述数据对象的增强数据对象。

    一种基于相似度计算的个性化职位推荐方法和系统

    公开(公告)号:CN106933821A

    公开(公告)日:2017-07-07

    申请号:CN201511016094.2

    申请日:2015-12-29

    CPC classification number: G06F17/30867

    Abstract: 本发明公开了一种基于相似度计算的个性化职位推荐方法和系统,涉及数据挖掘中推荐系统领域。其中的方法包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。即根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。

    数据处理方法、装置和计算机可读存储介质

    公开(公告)号:CN113468590B

    公开(公告)日:2025-05-06

    申请号:CN202010242952.X

    申请日:2020-03-31

    Abstract: 本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:标签缺失方接收标签持有方发送的对象的标签信息,标签信息包括:标签持有方加密后的各个标签的标签向量;标签缺失方根据标签信息,利用注意力机制确定本地持有的对象的各项特征相对于标签的重要度;标签缺失方根据各项特征相对于标签的重要度,调整各项特征对应的特征向量;标签缺失方将各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。本公开中标签缺失方根据注意力机制可以激活重要特征,去除无效特征,减小联合模型训练难度,同时提高了联合模型的准确率和训练效率。

    非均衡工业数据分类方法和装置、计算机可读存储介质

    公开(公告)号:CN114004266A

    公开(公告)日:2022-02-01

    申请号:CN202010731167.0

    申请日:2020-07-27

    Abstract: 本公开涉及一种非均衡工业数据分类方法和装置、计算机可读存储介质。该非均衡工业数据分类方法包括:将输入的非均衡数据集,划分为少数类样本集合和多数类样本集合;在采样过程通过对少数类样本集合诱导缺失值,并估算补全缺失值的方式,获得多个均衡子集;对每个均衡子集进行训练,获取子分类器;集成所有子分类器得到最终的数据分类器。本公开通过在采样过程对少数类样本诱导缺失值,并估算补全来实现,可以缓解降采样造成的潜在有用信息缺失问题。

    数据处理方法、装置和计算机可读存储介质

    公开(公告)号:CN113468590A

    公开(公告)日:2021-10-01

    申请号:CN202010242952.X

    申请日:2020-03-31

    Abstract: 本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:标签缺失方接收标签持有方发送的对象的标签信息,标签信息包括:标签持有方加密后的各个标签的标签向量;标签缺失方根据标签信息,利用注意力机制确定本地持有的对象的各项特征相对于标签的重要度;标签缺失方根据各项特征相对于标签的重要度,调整各项特征对应的特征向量;标签缺失方将各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。本公开中标签缺失方根据注意力机制可以激活重要特征,去除无效特征,减小联合模型训练难度,同时提高了联合模型的准确率和训练效率。

Patent Agency Ranking