Search Results - RepositoryStats

835

3.7k

mit

64

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) ...

Created 2017-08-22

274 commits to master branch, last one 3 years ago

LightZero opendilab

151

1.3k

apache-2.0

11

[NeurIPS 2023 Spotlight] LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios (awesome MCTS)

Created 2022-10-08

225 commits to main branch, last one 6 days ago

rl-tools rl-tools

29

783

mit

14

The Fastest Deep Reinforcement Learning Library

cpp mujoco tinyml tinyrl robotics deep-learning continuous-control reinforcement-learning

Created 2023-11-11

2,555 commits to master branch, last one 2 months ago

jaxrl ikostrikov

72

674

mit

13

JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

gym jax sac flax deep-learning soft-actor-critic behavioral-cloning continuous-control reinforcement-learning deep-reinforcement-learning batch-reinforcement-learning offline-reinforcement-learning deep-deterministic-policy-gradient

Created 2021-01-16

133 commits to main branch, last one 2 years ago

pytorch_sac denisyarats

108

539

mit

5

PyTorch implementation of Soft Actor-Critic (SAC)

gym sac d4pg mujoco pytorch dm-control actor-critic deep-learning soft-actor-critic continuous-control reinforcement-learning deep-reinforcement-learning

Created 2020-01-22

27 commits to master branch, last one 4 years ago

motion-planner-reinforcement-learning m5823779

49

231

unknown

4

End to end motion planner using Deep Deterministic Policy Gradient (DDPG) in gazebo

ddpg gazebo navigation tensorflow turtlebot3 ros-kinetic deep-learning motion-planner neural-network continuous-control deep-reinforcement-learning deep-deterministic-policy-gradient

Created 2019-07-20

17 commits to master branch, last one 2 years ago

off-policy-continuous-control zhihanyang2022

10

84

gpl-3.0

3

Official PyTorch code for "Recurrent Off-policy Baselines for Memory-based Continuous Control" (DeepRL Workshop, NeurIPS 21)

rdpg rsac rtd3 pytorch off-policy actor-critic continuous-control reinforcement-learning recurrent-neural-network

Created 2021-05-01

1,019 commits to pub branch, last one about a year ago

pytorch-rdpg fshamshirdar

24

55

unknown

3

PyTorch Implementation of the RDPG (Recurrent Deterministic Policy Gradient)

rdpg pytorch continuous-control recurrent-neural-networks deep-reinforcement-learning

Created 2018-02-10

17 commits to master branch, last one 5 years ago