Proximal Policy Optimization Algorithm

Rethinking Robotics Reinforcement Learning: A Practical Humanoid Training Workflow

A complete pipeline that can run on a single workstation to train a humanoid robot to walk over rough terrain.

Multi-Agent Proximal Policy Optimization for Dynamic Spectrum Access in Low-Altitude Intelligent Networks

Abstract: A novel dynamic spectrum access (DSA) scheme based on the multi-agent proximal policy optimization (MAPPO) algorithm is proposed to accommodate the dynamic and complex spectrum environment ...

IEEE

Improved Proximal Policy Optimization Algorithm for Sequential Security-Constrained Optimal Power Flow Based on Expert Knowledge and Safety Layer

Abstract: In recent years, reinforcement learning (RL) has emerged as a solution for model-free dynamic programming problem that cannot be effectively solved by traditional optimization methods. It ...

Some results have been hidden because they may be inaccessible to you

Show inaccessible results

Rethinking Robotics Reinforcement Learning: A Practical Humanoid Training Workflow

Multi-Agent Proximal Policy Optimization for Dynamic Spectrum Access in Low-Altitude Intelligent Networks

Improved Proximal Policy Optimization Algorithm for Sequential Security-Constrained Optimal Power Flow Based on Expert Knowledge and Safety Layer

Trending now