一种对抗式模仿学习中奖励函数的选择方法

    公开(公告)号:CN111401556A

    公开(公告)日:2020-07-10

    申请号:CN202010323155.4

    申请日:2020-04-22

    Inventor: 李秀 王亚伟 张明

    Abstract: 本发明提供一种对抗式模仿学习中奖励函数的选择方法,包括如下步骤:构建参数为θ的策略网络、参数为w的判别网络和至少两个奖励函数;获取专家策略下的示教数据并存入包含专家轨迹的专家数据缓存器中;控制策略网络的输入为仿真环境返回的状态,输出为决策动作;判别网络利用专家策略下的状态动作对和策略网络的状态动作对进行参数的更新;在计算奖励的阶段,判别网络的输入是策略网络的状态动作对,输出值是经过奖励函数计算得到的奖励值;根据不同奖励函数的性能指标的大小选择当前任务的奖励函数;保存与选择的奖励函数对应的策略网络的参数。智能体在不同奖励函数的指导下学习,进而在具体任务场景中依据性能评价指标挑选出最优奖励函数。

    一种绿色生态内加固护岸、护崖方法

    公开(公告)号:CN108729410A

    公开(公告)日:2018-11-02

    申请号:CN201810586617.4

    申请日:2018-06-06

    Applicant: 清华大学

    CPC classification number: E02B3/12 E02D5/18

    Abstract: 本发明公开一种绿色生态内加固护岸、护崖方法,包括以下步骤:1)首先进行岸坡整理,清除掉濒临坍塌的土体,且使岸坡的坡度小于休止角;2)在岸坡表面种植生态植物;3)对近岸坡的土体进行施工,在土中形成暗加固结构,所述暗加固结构距离所述生态植物的距离在所述暗加固结构的影响区内。本发明通过对岸坡进行内、外二重保护,可以完全不扰动岸坡表面的生态环境,岸坡表面不采取任何建筑结构性的工程措施,土体内部则采用暗加固技术,有效防止河道与水库土质岸坡的坍塌和土质陡崖的坍塌。

    一种有机电致发光器件
    16.
    发明授权

    公开(公告)号:CN101777627B

    公开(公告)日:2012-08-22

    申请号:CN200910264259.6

    申请日:2009-12-25

    Abstract: 本发明涉及一种有机电致发光器件,尤其涉及有机电致发光器件的引线设计。本发明所述有机电致发光器件,依次包括基板、发光区、引线区以及封装盖;引线区由使发光区与驱动芯片连接的引线构成,引线区包括邦定区和延伸区,邦定区为引线与驱动芯片连接的区域,延伸区位于邦定区外侧,延伸区引线由主电极引线和辅助电极引线构成,辅助电极引线的双侧边缘具有凸部。本发明所述技术方案能够有效防止有机电致发光器件在测试时延伸区引线由于脱边引起的行列连缺陷,避免短路对屏体造成损害。

    基于击实功复合作用函数逆向控制原理的地质力学模型制作方法

    公开(公告)号:CN100570671C

    公开(公告)日:2009-12-16

    申请号:CN200810056625.4

    申请日:2008-01-23

    Applicant: 清华大学

    Abstract: 一种基于击实功复合作用函数逆向控制原理的地质力学模型制作方法,属于地质力学模型技术领域。制作步骤为:确定特定模型的击实功复合作用函数及其参数,采用模型填筑逆向控制方法制作模型。根据击实功复合作用函数,计算模型各个分层的虚拟控制干容重和填筑方量,加以逆向控制,采用试验确定的压实方案进行压实,最终制作成各层的实际容重均满足设计需要的、性质均一的模型。优点在于,通过提出“击实功复合作用函数”和“虚拟容重”控制概念,提供了一种基于逆向控制原理的地质力学模型制作方法,克服了现有的地质力学模型压实制作方法由于超压而影响模型材料力学参数失真的不足,提高了模型制作质量。

    一种用于低弹模材料的压气式围压三轴流变仪

    公开(公告)号:CN101261259A

    公开(公告)日:2008-09-10

    申请号:CN200810056446.0

    申请日:2008-01-18

    Applicant: 清华大学

    Abstract: 一种用于低弹模材料的压气式围压三轴流变仪,属于试验仪器技术领域。包括:形成试件轴向压力的杠杆加载系统、形成试件侧向围压的压气加载系统、围压舱、压力罐、变形测量系统。形成试件侧向围压的压气加载系统包括形成围压并使其直接作用于试件侧表面的围压舱、储存和具有稳定气压作用的大容量压力罐;围压舱由密封底板、围压钢筒、上密封环、密封环定位压钣以及弹性橡胶膜构成;压力罐上装有压力表、进气阀和出气阀;出气阀通过压力软管与围压舱侧面的进气阀相联;变形测量系统由位移传感器、通道选择器、数据采集器、微机及数据处理软件组成。优点在于,精度、稳定性高,且无需任何能源。

    利用致电离辐射氧化亚硫酸铵的方法

    公开(公告)号:CN1199860C

    公开(公告)日:2005-05-04

    申请号:CN02131329.6

    申请日:2002-09-29

    Applicant: 清华大学

    Inventor: 徐光 张毅 张明

    Abstract: 一种利用致电离辐射氧化亚硫酸铵的方法,属化工技术领域。本方法是将浓度为30%的亚硫酸铵溶液通过喷嘴形成运动速度为5.5m/s的亚硫酸铵溶液微小雾滴,将该亚硫酸铵溶液微小雾滴通过有含氧气体存在的电离辐射场,被氧气氧化成为硫酸铵。本发明的方法能够用很小的能量付出,把亚硫酸铵氧化成为硫酸铵,具有低能耗、工艺流程简单的特点。

    一种高可靠性的离心纺丝电锭

    公开(公告)号:CN1020202C

    公开(公告)日:1993-03-31

    申请号:CN90101920.8

    申请日:1990-04-12

    Abstract: 离心纺丝电锭是一种由单个马达直接驱动的离心锭子,它是使用于纺织工业中,尤其是粘胶长纤维纺丝过程中的关键设备之一。本发明的特点在于利用单一轴替代了传统离心纺丝电锭的空心轴一实心轴双轴锥面配合定位及传扭结构;上轴承隐藏于电机杯式转子之中;下轴承可以采用普通的滚动轴承或滑动轴承,也可以采用全膜润滑的螺槽轴承;驱动电机既可以采用高效节能异步电机,也可以采用新型同步电机。与传统离心纺丝电锭相比,本离心纺丝电锭具有运转稳定可靠、故障率低、寿命长、耗能低、结构简单、制造方便等优点。

Patent Agency Ranking