Search Results - RepositoryStats

Reinforcement-learning-with-tensorflow MorvanZhou

5.0k

9.0k

mit

290

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Created 2017-05-06

114 commits to master branch, last one 2 years ago

cleanrl vwxyzjn

693

6.1k

other

38

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

a2c ale gym ppo atari wandb python pytorch actor-critic deep-learning machine-learning advantage-actor-critic phasic-policy-gradient reinforcement-learning deep-reinforcement-learning proximal-policy-optimization

Created 2019-06-07

835 commits to master branch, last one a day ago

Deep-reinforcement-learning-with-pytorch sweetice

863

4.1k

mit

36

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

a2c a3c dqn ppo sac td3 trpo sarsa resnet alphago pytorch algorithm reinforce actor-critic deep-learning policy-gradient actor-critic-algorithm deep-reinforcement-learning

Created 2018-06-09

4 commits to master branch, last one 4 years ago

Deep_reinforcement_learning_Course simoninithomas

1.2k

3.8k

unknown

132

Implementations from the free course Deep Reinforcement Learning with Tensorflow and PyTorch

a2c ppo unity pytorch qlearning tensorflow actor-critic deep-learning deep-q-network deep-q-learning tensorflow-tutorials deep-reinforcement-learning

Created 2018-03-25

166 commits to master branch, last one about a year ago

pytorch-a2c-ppo-acktr-gail ikostrikov

830

3.7k

mit

66

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) ...

Created 2017-08-22

274 commits to master branch, last one 3 years ago

reinforcement-learning rlcode

738

3.4k

mit

129

Minimal and Clean Reinforcement Learning Examples

a3c dqn actor-critic deep-learning deep-q-network policy-gradient machine-learning reinforcement-learning deep-reinforcement-learning

Created 2017-01-13

264 commits to master branch, last one 7 years ago

pytorch-a3c ikostrikov

279

1.2k

mit

42

PyTorch implementation of Asynchronous Advantage Actor Critic (A3C) from "Asynchronous Methods for Deep Reinforcement Learning".

a3c asynch python pytorch pytorch-a3c actor-critic deep-learning asynchronous-methods reinforcement-learning deep-reinforcement-learning asynchronous-advantage-actor-critic

Created 2017-02-13

46 commits to master branch, last one 5 years ago

chainerrl chainer

225

1.2k

mit

70

ChainerRL is a deep reinforcement learning library built on top of Chainer.

dqn python chainer actor-critic deep-learning machine-learning reinforcement-learning

Created 2017-01-30

3,471 commits to master branch, last one 3 years ago

DeepRL-Tutorials qfettes

326

1.1k

unknown

30

Contains high quality implementations of Deep Reinforcement Learning algorithms written in PyTorch

Created 2018-05-31

88 commits to master branch, last one 5 years ago

pytorch-rl jingweiz

143

797

mit

24

Deep Reinforcement Learning with pytorch & visdom

a3c dqn acer trpo visdom pytorch pytorch-a3c actor-critic deep-learning reinforcement-learning deep-reinforcement-learning

Created 2017-04-10

85 commits to master branch, last one 6 years ago

RLSeq2Seq yaserkl

162

764

mit

28

Deep Reinforcement Learning For Sequence to Sequence Models

nlp actor-critic policy-gradient pointer-generator reinforcement-learning abstractive-text-summarization

Created 2018-05-24

181 commits to master branch, last one 5 years ago

reinforcement-learning-algorithms TianhongDai

110

672

unknown

15

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are st...

a2c dqn ppo sac ddpg trpo pytorch algorithm atari2600 dueling-dqn flappy-bird actor-critic deep-learning soft-actor-critic deep-reinforcement-learning proximal-policy-optimization trust-region-policy-optimization

Created 2018-01-13

25 commits to master branch, last one 4 years ago

pytorch-A3C MorvanZhou

144

624

mit

14

Simple A3C implementation with pytorch + multiprocessing

a3c gym pytorch toy-example actor-critic neural-network multiprocessing asynchronous-advantage-actor-critic

Created 2018-01-18

17 commits to master branch, last one 4 years ago

dissecting-reinforcement-learning mpatacchiola

177

616

mit

55

Python code, PDFs and resources for the series of posts on Reinforcement Learning which I published on my personal blog

sarsa q-learning actor-critic markov-chain mountain-car drone-landing neural-networks genetic-algorithm inverted-pendulum multi-armed-bandit reinforcement-learning deep-reinforcement-learning temporal-differencing-learning dissecting-reinforcement-learning

Created 2016-12-09

89 commits to master branch, last one about a year ago

rl_a3c_pytorch dgriff777

119

563

apache-2.0

21

A3C LSTM Atari with Pytorch plus A3G design

a3c a3g atari python a3c-gpu pytorch openai-gym pytorch-a3c actor-critic reinforcement-learning deep-reinforcement-learning asynchronous-advantage-actor-critic

Created 2017-05-25

172 commits to master branch, last one about a year ago

pytorch_sac denisyarats

104

523

mit

6

PyTorch implementation of Soft Actor-Critic (SAC)

gym sac d4pg mujoco pytorch dm-control actor-critic deep-learning soft-actor-critic continuous-control reinforcement-learning deep-reinforcement-learning

Created 2020-01-22

27 commits to master branch, last one 3 years ago

drq denisyarats

53

412

mit

13

DrQ: Data regularized Q

rl drq gym sac pixel mujoco python control pytorch dm-control model-free off-policy actor-critic deep-learning soft-actor-crit data-augmentation reinforcement-learning deep-reinforcement-learning

Created 2020-04-29

14 commits to master branch, last one 3 years ago

Machine-Learning-is-ALL-You-Need Skylark0924

93

399

unknown

11

🔥🌟《Machine Learning 格物志》: ML + DL + RL basic codes and notes by sklearn, PyTorch, TensorFlow, Keras & the most important, from scratch!💪 This repository is ALL You Need!

Created 2020-04-02

130 commits to master branch, last one about a year ago

Deep-Reinforcement-Learning-With-Python sudharsan13296

131

395

unknown

11

Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math

a2c a3c c51 dqn ppo sac td3 ddpg trpo double-dqn openai-gym q-learning actor-critic deep-learning policy-gradient bellman-equation reinforcement-learning deep-reinforcement-learning inverse-reinforcement-learning

Created 2020-10-02

23 commits to master branch, last one 3 years ago

Hands-On-Intelligent-Agents-with-OpenAI-Gym PacktPublishing

149

377

mit

18

Code for Hands On Intelligent Agents with OpenAI Gym book to get started and learn to build deep reinforcement learning agents using PyTorch

dqn pytorch openai-gym pytorch-a3c actor-critic pytorch-carla carla-simulator learning-agents intelligent-agents advantage-actor-critic carla-driving-simulator deep-reinforcement-learning

Created 2018-05-09

244 commits to master branch, last one 2 years ago

Hierarchical-Actor-Critic-HAC-PyTorch nikhilbarhate99

51

304

mit

8

PyTorch implementation of Hierarchical Actor Critic (HAC) for OpenAI gym environments

pytorch openai-gym pytorch-rl actor-critic gym-environment gym-environments pytorch-implementation reinforcement-learning deep-reinforcement-learning reinforcement-learning-algorithms hierarchical-reinforcement-learning

Created 2019-06-03

38 commits to master branch, last one 3 years ago

adeptRL heronsystems

29

204

gpl-3.0

21

Reinforcement learning framework to accelerate research

atari pysc2 pytorch actor-critic starcraft2-ai reinforcement-learning artificial-intelligence

Created 2018-08-23

275 commits to master branch, last one 3 years ago

torch-ac lcswillems

66

193

mit

8

Recurrent and multi-process PyTorch implementation of deep reinforcement Actor-Critic algorithms A2C and PPO

a2c a3c ppo pytorch minigrid recurrent actor-critic multi-process reward-shaping advantage-actor-critic reinforcement-learning recurrent-neural-networks deep-reinforcement-learning proximal-policy-optimization

Created 2019-04-07

25 commits to master branch, last one 2 years ago

ReinforcementLearning-AtariGame Nasdin

39

177

bsd-3-clause

10

Pytorch LSTM RNN for reinforcement learning to play Atari games from OpenAI Universe. We also use Google Deep Mind's Asynchronous Advantage Actor-Critic (A3C) Algorithm. This is much superior and effi...

a3c adam lstm python pytorch rmsprop a3c-lstm universe openai-gym actor-critic reinforcement-agents reinforcement-learning deep-reinforcement-learning reinforcement-learning-algorithms asynchronous-advantage-actor-critic

Created 2017-09-27

14 commits to master branch, last one 4 months ago

baby-a3c greydanus

43

171

apache-2.0

5

A high-performance Atari A3C agent in 180 lines of PyTorch

a3c atari pytorch pytorch-rl pytorch-a3c actor-critic deep-reinforcement-learning

Created 2017-10-03

42 commits to master branch, last one 3 years ago

TSP_DRL_PtrNet Rintarooo

34

168

mit

3

"Neural Combinatorial Optimization with Reinforcement Learning"[Bello+, 2016], Traveling Salesman Problem solver

tsp pytorch actor-critic active-search pointer-networks deep-reinforcement-learning

Created 2020-05-11

80 commits to master branch, last one 3 years ago

episodic-transformer-memory-ppo MarcoMeter

21

164

mit

4

Clean baseline implementation of PPO using an episodic TransformerXL memory

ppo trxl gtrxl pomdp pytorch on-policy memory-gym transformer actor-critic transformer-xl episodic-memory policy-gradient gated-transformer-xl deep-reinforcement-learning proximal-policy-optimization

Created 2022-05-04

9 commits to main branch, last one 7 months ago

Overcoming-exploration-from-demos jangirrishabh

30

152

mit

5

Implementation of the paper "Overcoming Exploration in Reinforcement Learning with Demonstrations" Nair et al. over the HER baselines from OpenAI

ros gazebo robotics openai-gym actor-critic ddpg-algorithm reinforcement-learning hindsight-experience-replay learning-from-demonstration reinforcement-learning-agent

Created 2018-06-11

54 commits to master branch, last one 3 years ago

recurrent-ppo-truncated-bptt MarcoMeter

18

134

mit

4

Baseline implementation of recurrent PPO using truncated BPTT

gru ppo bptt lstm pomdp pytorch on-policy recurrent truncated recurrence actor-critic deep-learning policy-gradient recurrent-neural-networks deep-reinforcement-learning proximal-policy-optimization

Created 2021-06-07

13 commits to main branch, last one about a year ago

visualize_atari greydanus

34

120

unknown

3

Code for our paper "Visualizing and Understanding Atari Agents" (https://goo.gl/AMAoSc)

pytorch actor-critic saliency-map visualization neural-networks deep-reinforcement-learning

Created 2017-10-31

14 commits to master branch, last one 3 years ago