发明公开
- 专利标题: 一种半监督学习方法、系统、设备和存储介质及语义解析方法
-
申请号: CN202011543169.3申请日: 2020-12-21
-
公开(公告)号: CN112464645A公开(公告)日: 2021-03-09
- 发明人: 谈元鹏 , 欧智坚 , 徐会芳 , 彭国政 , 胡若云 , 杜文勇 , 邓志东 , 宋运福
- 申请人: 中国电力科学研究院有限公司 , 清华大学 , 国家电网有限公司客户服务中心 , 国网浙江省电力有限公司营销服务中心 , 国家电网有限公司
- 申请人地址: 北京市海淀区清河小营东路15号; ; ; ;
- 专利权人: 中国电力科学研究院有限公司,清华大学,国家电网有限公司客户服务中心,国网浙江省电力有限公司营销服务中心,国家电网有限公司
- 当前专利权人: 中国电力科学研究院有限公司,清华大学,国家电网有限公司客户服务中心,国网浙江省电力有限公司营销服务中心,国家电网有限公司
- 当前专利权人地址: 北京市海淀区清河小营东路15号; ; ; ;
- 代理机构: 北京中巡通大知识产权代理有限公司
- 代理商 李宏德
- 优先权: 2020112000826 20201030 CN
- 主分类号: G06F40/211
- IPC分类号: G06F40/211 ; G06F40/30 ; G06K9/62
摘要:
本发明提供一种半监督学习方法、系统、设备和存储介质及语义解析方法,设计合理,应用简单,在输出数据是离散变量的情况下,能够避免梯度传递的问题。所述方法包括,采用配对的输入数据集进行最大化条件似然的序列到序列学习,实现有监督学习;采用未配对的输入数据集基于联合随机近似进行学习,实现无监督学习;设定有监督学习目标和无监督学习目标的权重分配;按照权重分配将有监督学习目标和无监督学习目标联合为联合优化目标;根据联合优化目标,同时进行有监督学习和无监督学习。本发明将联合随机近似拓展到序列到序列半监督学习中,利用配对的数据集和未配对的输入数据集同时进行学习,提高了学习的效率和效果。