非均衡工业数据分类方法和装置、计算机可读存储介质

    公开(公告)号:CN114004266A

    公开(公告)日:2022-02-01

    申请号:CN202010731167.0

    申请日:2020-07-27

    Abstract: 本公开涉及一种非均衡工业数据分类方法和装置、计算机可读存储介质。该非均衡工业数据分类方法包括:将输入的非均衡数据集,划分为少数类样本集合和多数类样本集合;在采样过程通过对少数类样本集合诱导缺失值,并估算补全缺失值的方式,获得多个均衡子集;对每个均衡子集进行训练,获取子分类器;集成所有子分类器得到最终的数据分类器。本公开通过在采样过程对少数类样本诱导缺失值,并估算补全来实现,可以缓解降采样造成的潜在有用信息缺失问题。

    摘要自动生成方法、装置和计算机可读存储介质

    公开(公告)号:CN113468318A

    公开(公告)日:2021-10-01

    申请号:CN202010243842.5

    申请日:2020-03-31

    Abstract: 本发明公开了一种摘要自动生成方法、装置和计算机可读存储介质,涉及文本处理领域。摘要自动生成方法包括:根据待提取摘要的文本中的每个句子与其他句子的关联关系,确定每个句子的重要性得分;将待提取摘要的文本中每个句子对应的词语序列输入预先训练的、基于注意力机制的深度学习模型,获得深度学习模型输出的、每个句子的情感得分;根据每个句子的重要性得分和情感得分,确定每个句子的总得分;根据总得分,筛选出待提取摘要的文本中的关键句子;根据关键句子生成摘要。本发明的实施例参考句子重要程度属性以及情感属性进行打分,从而可以准确地从文本中提取能够表达作者观点的核心信息,使得生成的摘要更准确。

    结构化查询语言语句生成方法和装置

    公开(公告)号:CN113032417A

    公开(公告)日:2021-06-25

    申请号:CN201911356000.4

    申请日:2019-12-25

    Abstract: 本公开提出一种结构化查询语言语句生成方法和装置,涉及人工智能技术领域。本公开的一种SQL语句生成方法,包括:获取用户在对话中的表达信息;基于增加动态词向量BERT模型的双向长短时记忆网络Bi‑LSTM和条件随机场CRT模型,从表达信息中抽取有效信息,有效信息包括时间、实体或指标中的一项或多项;根据有效信息,基于SQL语句的语法生成结构化查询语言SQL语句。通过这样的方法,能够降低对用户使用数据库能力的要求,也提高了有效信息提取的效率和准确度,无需预先生成固定查询句式,提高了SQL语句生成的可扩展性。

Patent Agency Ranking