-
公开(公告)号:CN113468590A
公开(公告)日:2021-10-01
申请号:CN202010242952.X
申请日:2020-03-31
Applicant: 中国电信股份有限公司
Abstract: 本公开涉及一种数据处理方法、装置和计算机可读存储介质,涉及计算机技术领域。本公开的方法包括:标签缺失方接收标签持有方发送的对象的标签信息,标签信息包括:标签持有方加密后的各个标签的标签向量;标签缺失方根据标签信息,利用注意力机制确定本地持有的对象的各项特征相对于标签的重要度;标签缺失方根据各项特征相对于标签的重要度,调整各项特征对应的特征向量;标签缺失方将各项特征调整后的特征向量输入联合模型中标签缺失方所持有的模型进行联邦学习。本公开中标签缺失方根据注意力机制可以激活重要特征,去除无效特征,减小联合模型训练难度,同时提高了联合模型的准确率和训练效率。
-
公开(公告)号:CN113094538A
公开(公告)日:2021-07-09
申请号:CN201911334579.4
申请日:2019-12-23
Applicant: 中国电信股份有限公司
IPC: G06F16/583 , G06F16/58 , G06N3/04 , G06N3/08
Abstract: 本公开涉及一种图像的检索方法、装置和计算机可读存储介质,涉及计算机技术领域。该方法包括根据提取的目标图像的特征向量,利用第一机器学习模型,确定目标图像的描述文本;利用第二机器学习模型,对目标图像进行人脸识别,确定目标图像的身份信息;根据多个目标图像的描述文本和身份信息,对用户提供的检索关键词进行匹配,在多个目标图像中确定相应的检索结果。
-
公开(公告)号:CN113032417A
公开(公告)日:2021-06-25
申请号:CN201911356000.4
申请日:2019-12-25
Applicant: 中国电信股份有限公司
IPC: G06F16/242
Abstract: 本公开提出一种结构化查询语言语句生成方法和装置,涉及人工智能技术领域。本公开的一种SQL语句生成方法,包括:获取用户在对话中的表达信息;基于增加动态词向量BERT模型的双向长短时记忆网络Bi‑LSTM和条件随机场CRT模型,从表达信息中抽取有效信息,有效信息包括时间、实体或指标中的一项或多项;根据有效信息,基于SQL语句的语法生成结构化查询语言SQL语句。通过这样的方法,能够降低对用户使用数据库能力的要求,也提高了有效信息提取的效率和准确度,无需预先生成固定查询句式,提高了SQL语句生成的可扩展性。
-
公开(公告)号:CN116168468B
公开(公告)日:2024-12-10
申请号:CN202111403344.3
申请日:2021-11-24
Applicant: 中国电信股份有限公司
IPC: G07C5/08
Abstract: 公开了车辆碰撞识别方法和装置。车辆碰撞识别方法包括:接收来自车辆的车辆数据,车辆数据包括加速踏板位置数据、车辆速度数据、驾驶员需求扭矩数据、低压蓄电池电压数据和电池包继电器状态数据;基于电池包继电器状态数据来确定可能发生碰撞的时间点;取得包含所确定的时间点的预定时间段内的车辆数据,并且基于所取得车辆数据,通过使用深度学习模型来确定车辆是否发生碰撞,其中,在确定发生碰撞的情况下,将所述可能发生碰撞的时间点确定为碰撞时间点。
-
公开(公告)号:CN115114918B
公开(公告)日:2024-09-06
申请号:CN202110286687.X
申请日:2021-03-17
Applicant: 中国电信股份有限公司
IPC: G06F40/295 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/092
Abstract: 本公开提供了一种实体关系抽取方法、装置、数据标注系统以及存储介质,其中的方法包括:使用强化学习模型对词向量以及初始关系子图进行处理,获取词向量中的各个词之间的实体关系抽取信息;基于实体关系抽取信息生成关系子图,使用关系图处理模型对关系子图进行处理,生成与关系子图相对应的关系子图特征信息;基于词向量和关系子图特征信息,生成强化学习模型的状态信息,使用强化学习模型对状态信息进行处理,用以获取新实体关系抽取信息。本公开的方法、装置以及存储介质,将NLP的实体关系生成问题转换为实体关系图的生成问题,能够高效地表征实体关系,降低了人工成本,提高了标注效率。
-
公开(公告)号:CN115170769A
公开(公告)日:2022-10-11
申请号:CN202210861870.2
申请日:2022-07-20
Applicant: 中国电信股份有限公司
Abstract: 本公开提供了一种目标检测方法、装置、电子设备及计算机可读存储介质,涉及自动驾驶技术领域。该方法包括:获取图像融合数据及对应的点云融合数据;对图像融合数据进行编码并从编码处理的多个阶段得到分辨率不同的多个图像特征图;将点云融合数据动态体素化,确定点云融合数据中各个点云点对应的体素索引;对点云融合数据进行编码,得到第一点云特征图;将多个图像特征图与第一点云特征图进行特征融合,得到第二点云特征图;根据第二点云特征图和体素索引进行目标检测,得到检测结果。通过点云动态体素化以及图像、点云数据在数据层、特征层融合的方式实现目标检测,使得检测结果具有更高的精度。
-
公开(公告)号:CN115114918A
公开(公告)日:2022-09-27
申请号:CN202110286687.X
申请日:2021-03-17
Applicant: 中国电信股份有限公司
IPC: G06F40/295 , G06N3/04 , G06N3/08 , G06N20/00
Abstract: 本公开提供了一种实体关系抽取方法、装置、数据标注系统以及存储介质,其中的方法包括:使用强化学习模型对词向量以及初始关系子图进行处理,获取词向量中的各个词之间的实体关系抽取信息;基于实体关系抽取信息生成关系子图,使用关系图处理模型对关系子图进行处理,生成与关系子图相对应的关系子图特征信息;基于词向量和关系子图特征信息,生成强化学习模型的状态信息,使用强化学习模型对状态信息进行处理,用以获取新实体关系抽取信息。本公开的方法、装置以及存储介质,将NLP的实体关系生成问题转换为实体关系图的生成问题,能够高效地表征实体关系,降低了人工成本,提高了标注效率。
-
公开(公告)号:CN114970650A
公开(公告)日:2022-08-30
申请号:CN202110211262.2
申请日:2021-02-25
Applicant: 中国电信股份有限公司
IPC: G06K9/62
Abstract: 本公开涉及用户数据的分类方法,包括:使用第一用户数据集训练得到预分类模型;将第一用户数据集中的各个样本输入预分类模型,以得到第一用户数据集中的各个样本属于各个类别的概率;基于第一用户数据集中的各个样本属于各个类别的概率获得第一用户数据集中的各个样本的类别区分度;基于第一用户数据集中的各个样本的类别区分度的大小排列第一用户数据集中的各个样本,并基于经排列的第一用户数据集中的各个样本拟合类别区分度曲线;确定类别区分度曲线的斜率变点,并基于确定的斜率变点设置阈值;将第一用户数据集中样本的类别区分度大于阈值的样本确定为第一样本集,并将第一用户数据集中样本的类别区分度小于等于阈值的样本确定为第二样本集。
-
公开(公告)号:CN114064887A
公开(公告)日:2022-02-18
申请号:CN202010789559.2
申请日:2020-08-07
Applicant: 中国电信股份有限公司
IPC: G06F16/35 , G06F40/289 , G06F40/216 , G06N3/04 , G06N3/08
Abstract: 本公开涉及数据增强方法和装置。提供了一种用于增强语料库中的数据对象的数据增强方法,包括:针对所述语料库中的至少一部分数据对象中的每个数据对象:将所述数据对象分解成多个词语;计算所述多个词语中的每个词语的重要性得分,所述重要性得分表示该词语是所述数据对象的主题词的概率;基于所述重要性得分,按特定概率对所述多个词语进行抽取,使得所述重要性得分越高的词语被抽取到的概率越小;以及针对抽取到的每个词语进行替换、删除以及插入中的至少一个的处理,从而获得所述数据对象的增强数据对象。
-
公开(公告)号:CN106933821A
公开(公告)日:2017-07-07
申请号:CN201511016094.2
申请日:2015-12-29
Applicant: 中国电信股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30867
Abstract: 本发明公开了一种基于相似度计算的个性化职位推荐方法和系统,涉及数据挖掘中推荐系统领域。其中的方法包括:提取并分析用户行为数据,建立用户兴趣模型;根据用户兴趣模型,计算各用户之间或各职位之间的相似度;对相似度的值排序,获取与当前用户相似度最高的前N个用户集,或与当前职位相似度最高的前N个职位集;将前N个用户集中相似用户申请的职位或前N个职位集中相似职位推荐给当前用户。即根据用户浏览和访问职位的行为信息,建立用户职位兴趣模型,实现个性化职位推荐,可以帮助用户更快更好地发现和找到自己感兴趣的以及适合自己的职位。
-
-
-
-
-
-
-
-
-