Search Results - RepositoryStats

2.0k

10.8k

other

78

强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/

a3c dqn ppo td3 ddpg sarsa easy-rl double-dqn q-learning dueling-dqn policy-gradient imitation-learning reinforcement-learning deep-reinforcement-learning

Created 2020-07-03

1,204 commits to master branch, last one 2 days ago

Reinforcement-learning-with-tensorflow MorvanZhou

5.0k

9.1k

mit

290

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Created 2017-05-06

114 commits to master branch, last one 2 years ago

tianshou thu-ml

1.1k

8.3k

mit

91

An elegant PyTorch deep reinforcement learning library.

rl a2c bcq cql dqn drl npg ppo sac td3 ddpg trpo atari mujoco pytorch double-dqn transferlab policy-gradient imitation-learning

Created 2018-04-16

847 commits to master branch, last one 27 days ago

cleanrl vwxyzjn

724

6.7k

other

39

High-quality single file implementation of Deep Reinforcement Learning algorithms with research-friendly features (PPO, DQN, C51, DDPG, TD3, SAC, PPG)

a2c ale gym ppo atari wandb python pytorch actor-critic deep-learning machine-learning advantage-actor-critic phasic-policy-gradient reinforcement-learning deep-reinforcement-learning proximal-policy-optimization

Created 2019-06-07

836 commits to master branch, last one about a month ago

deep-reinforcement-learning udacity

2.4k

5.0k

mit

177

Repo for the Deep Reinforcement Learning Nanodegree program

dqn ppo ddpg pytorch ml-agents openai-gym pytorch-rl cross-entropy hill-climbing rl-algorithms neural-networks dynamic-programming openai-gym-solutions reinforcement-learning deep-reinforcement-learning reinforcement-learning-algorithms

Created 2018-07-06

24 commits to master branch, last one 3 years ago

Reinforcement-Learning andri27-ts

628

4.3k

mit

245

Learn Deep Reinforcement Learning in 60 days! Lectures & Code in Python. Reinforcement Learning + Deep Learning

a2c dqn ppo deepmind qlearning deep-learning machine-learning policy-gradients evolution-strategies reinforcement-learning artificial-intelligence deep-reinforcement-learning

Created 2018-08-28

146 commits to master branch, last one 4 years ago

Deep-reinforcement-learning-with-pytorch sweetice

874

4.2k

mit

35

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

a2c a3c dqn ppo sac td3 trpo sarsa resnet alphago pytorch algorithm reinforce actor-critic deep-learning policy-gradient actor-critic-algorithm deep-reinforcement-learning

Created 2018-06-09

4 commits to master branch, last one 5 years ago

ElegantRL AI4Finance-Foundation

888

4.0k

other

51

Massively Parallel Deep Reinforcement Learning. 🔥

a2c dqn gae per ppo sac td3 ddpg stable pytorch efficient drl-pytorch lightweight multiple-gpu model-free-rl bipedalwalkerhardcore reinforcement-learning

Created 2019-07-12

2,852 commits to master branch, last one 16 days ago

Deep_reinforcement_learning_Course simoninithomas

1.2k

3.8k

unknown

131

Implementations from the free course Deep Reinforcement Learning with Tensorflow and PyTorch

a2c ppo unity pytorch qlearning tensorflow actor-critic deep-learning deep-q-network deep-q-learning tensorflow-tutorials deep-reinforcement-learning

Created 2018-03-25

166 commits to master branch, last one about a year ago

pytorch-a2c-ppo-acktr-gail ikostrikov

835

3.7k

mit

64

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) ...

Created 2017-08-22

274 commits to master branch, last one 3 years ago

DeepRL ShangtongZhang

692

3.3k

mit

89

Modularized Implementation of Deep RL Algorithms in PyTorch

a2c dqn ppo td3 ddpg deeprl pytorch rainbow double-dqn option-critic categorical-dqn quantile-regression option-critic-architecture deep-reinforcement-learning dueling-network-architecture prioritized-experience-replay

Created 2017-04-20

480 commits to master branch, last one 11 months ago

minimalRL seungeunrho

462

3.0k

mit

50

Implementations of basic RL algorithms with minimal lines of codes! (pytorch based)

a2c a3c dqn ppo sac acer ddpg simple pytorch reinforce deep-learning machine-learning policy-gradients reinforcement-learning deep-reinforcement-learning

Created 2019-04-23

91 commits to master branch, last one about a year ago

FinRL-Trading AI4Finance-Foundation

779

2.3k

mit

98

For trading. Please star.

ppo ddpg openai-gym sharpe-ratio a2c-algorithm stock-trading ensemble-strategy stock-trading-strategy automated-stock-trading deep-reinforcement-learning

Created 2020-07-26

199 commits to master branch, last one 9 months ago

DRL-Pytorch XinJingHao

272

2.1k

unknown

12

Clean, Robust, and Unified PyTorch implementation of popular Deep Reinforcement Learning (DRL) algorithms (Q-learning, Duel DDQN, PER, C51, Noisy DQN, PPO, DDPG, TD3, SAC, ASL)

asl c51 ppo sac td3 ddpg pytorch double-dqn q-learning dueling-dqn noisynet-dqn categorical-dqn machine-learning reinforcement-learning deep-reinforcement-learning prioritized-experience-replay

Created 2021-11-14

107 commits to main branch, last one 29 days ago

PPO-PyTorch nikhilbarhate99

373

2.0k

mit

6

Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

ppo pytorch ppo-pytorch deep-learning policy-gradient pytorch-tutorial pytorch-implmention reinforcement-learning deep-reinforcement-learning proximal-policy-optimization reinforcement-learning-algorithms

Created 2018-09-27

98 commits to master branch, last one about a year ago

on-policy marlbenchmark

319

1.5k

mit

8

This is the official implementation of Multi-Agent PPO (MAPPO).

ppo mpes smac mappo hanabi algorithms multi-agent starcraftii

Created 2021-02-23

130 commits to main branch, last one 8 months ago

SLM-Lab kengz

274

1.3k

mit

46

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

a2c a3c dqn ppo sac pytorch benchmark policy-gradient reinforcement-learning deep-reinforcement-learning

Created 2017-10-02

2,573 commits to master branch, last one about a month ago

PyTorch-RL Khrylx

191

1.2k

mit

26

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

a2c ppo trpo pytorch pytorch-rl fisher-vectors policy-gradient reinforcement-learning deep-reinforcement-learning proximal-policy-optimization generative-adversarial-network

Created 2017-10-17

100 commits to master branch, last one 4 years ago

Super-mario-bros-PPO-pytorch vietnh1009

209

1.1k

mit

28

Proximal Policy Optimization (PPO) algorithm for Super Mario Bros

ai gym ppo ppo2 mario openai python python3 pytorch openai-gym deep-learning super-mario-bros reinforcement-learning proximal-policy-optimization

Created 2019-10-02

9 commits to master branch, last one 3 years ago

DeepRL-Tutorials qfettes

327

1.1k

unknown

30

Contains high quality implementations of Deep Reinforcement Learning algorithms written in PyTorch

Created 2018-05-31

88 commits to master branch, last one 6 years ago

PPO-for-Beginners ericyangyu

134

916

mit

12

A simple and well styled PPO implementation. Based on my Medium series: https://medium.com/@eyyu/coding-ppo-from-scratch-with-pytorch-part-1-4-613dfc1b14c8.

ppo pytorch machine-learning reinforcement-learning reinforcement-learning-algorithms

Created 2020-09-04

49 commits to master branch, last one 6 months ago

Deep-Reinforcement-Learning-Algorithms Rafael1s

206

849

unknown

15

32 projects in the framework of Deep Reinforcement Learning algorithms: Q-learning, DQN, PPO, DDPG, TD3, SAC, A2C and others. Each project is provided with a detailed training log.

a2c dqn ppo sac td3 ddpg cartpole carracing lunarlander antbulletenv dqn-ppo-ddpg bipedalwalker github-udacity hopperbulletenv soft-actor-critic walker2dbulletenv deep-rl-algorithms halfcheetahbulletenv deep-reinforcement-learning

Created 2019-04-07

995 commits to master branch, last one 3 years ago

Hands-On-Reinforcement-Learning-With-Python sudharsan13296

325

846

unknown

43

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

Created 2018-06-11

44 commits to master branch, last one 4 years ago

purejaxrl luchris429

69

844

apache-2.0

13

Really Fast End-to-End Jax RL Implementations

jax ppo reinforcement-learning deep-reinforcement-learning reinforcement-learning-algorithms

Created 2023-02-25

35 commits to main branch, last one 6 months ago

HALOs ContextualAI

51

821

apache-2.0

7

A library with extensible implementations of DPO, KTO, PPO, ORPO, and other human-aware loss functions (HALOs).

dpo kto ppo rlhf halos alignment

Created 2023-12-03

227 commits to main branch, last one 2 months ago

xuance agi-brain

120

799

mit

15

XuanCe: A Comprehensive and Unified Deep Reinforcement Learning Library

Created 2023-05-21

1,642 commits to master branch, last one a day ago

rl-starter-files lcswillems

186

677

mit

13

RL starter files in order to immediately train, visualize and evaluate an agent without writing any line of code

a2c a3c ppo pytorch minigrid multi-process reward-shaping preprocessed-observations

Created 2018-04-11

497 commits to master branch, last one about a year ago

reinforcement-learning-algorithms TianhongDai

111

674

unknown

14

This repository contains most of pytorch implementation based classic deep reinforcement learning algorithms, including - DQN, DDQN, Dueling Network, DDPG, SAC, A2C, PPO, TRPO. (More algorithms are st...

a2c dqn ppo sac ddpg trpo pytorch algorithm atari2600 dueling-dqn flappy-bird actor-critic deep-learning soft-actor-critic deep-reinforcement-learning proximal-policy-optimization trust-region-policy-optimization

Created 2018-01-13

25 commits to master branch, last one 4 years ago

autonomous-learning-library cpnota

72

652

mit

21

A PyTorch library for building deep reinforcement learning agents.

a2c dqn ppo sac ddpg dqn-pytorch deep-q-learning soft-actor-critic advantage-actor-critic reinforcement-learning deep-reinforcement-learning proximal-policy-optimization reinforcement-learning-algorithms deep-deterministic-policy-gradient

Created 2018-11-07

300 commits to develop branch, last one about a year ago

DeepRL-TensorFlow2 archsyscall

142

607

apache-2.0

18

🐋 Simple implementations of various popular Deep Reinforcement Learning algorithms using TensorFlow2

a2c a3c dqn ppo sac ddpg trpo reinforce double-dqn tensorflow dueling-dqn rainbow-dqn tensorflow2 deep-learning machine-learning reinforcement-learning deep-reinforcement-learning

Created 2020-03-09

96 commits to master branch, last one 4 years ago