Search Results - RepositoryStats

2.0k

10.9k

other

78

强化学习中文教程（蘑菇书🍄），在线阅读地址：https://datawhalechina.github.io/easy-rl/

a3c dqn ppo td3 ddpg sarsa easy-rl double-dqn q-learning dueling-dqn policy-gradient imitation-learning reinforcement-learning deep-reinforcement-learning

Created 2020-07-03

1,204 commits to master branch, last one 17 days ago

Reinforcement-learning-with-tensorflow MorvanZhou

5.0k

9.2k

mit

290

Simple Reinforcement learning tutorials, 莫烦Python 中文AI教学

Created 2017-05-06

114 commits to master branch, last one 2 years ago

tianshou thu-ml

1.1k

8.4k

mit

91

An elegant PyTorch deep reinforcement learning library.

rl a2c bcq cql dqn drl npg ppo sac td3 ddpg trpo atari mujoco pytorch double-dqn transferlab policy-gradient imitation-learning

Created 2018-04-16

847 commits to master branch, last one about a month ago

Deep-reinforcement-learning-with-pytorch sweetice

874

4.2k

mit

35

PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....

a2c a3c dqn ppo sac td3 trpo sarsa resnet alphago pytorch algorithm reinforce actor-critic deep-learning policy-gradient actor-critic-algorithm deep-reinforcement-learning

Created 2018-06-09

4 commits to master branch, last one 5 years ago

reinforcement-learning rlcode

738

3.5k

mit

127

Minimal and Clean Reinforcement Learning Examples

a3c dqn actor-critic deep-learning deep-q-network policy-gradient machine-learning reinforcement-learning deep-reinforcement-learning

Created 2017-01-13

264 commits to master branch, last one 7 years ago

PPO-PyTorch nikhilbarhate99

375

2.0k

mit

6

Minimal implementation of clipped objective Proximal Policy Optimization (PPO) in PyTorch

ppo pytorch ppo-pytorch deep-learning policy-gradient pytorch-tutorial pytorch-implmention reinforcement-learning deep-reinforcement-learning proximal-policy-optimization reinforcement-learning-algorithms

Created 2018-09-27

98 commits to master branch, last one about a year ago

SLM-Lab kengz

274

1.3k

mit

46

Modular Deep Reinforcement Learning framework in PyTorch. Companion library of the book "Foundations of Deep Reinforcement Learning".

a2c a3c dqn ppo sac pytorch benchmark policy-gradient reinforcement-learning deep-reinforcement-learning

Created 2017-10-02

2,573 commits to master branch, last one about a month ago

PyTorch-RL Khrylx

190

1.2k

mit

26

PyTorch implementation of Deep Reinforcement Learning: Policy Gradient methods (TRPO, PPO, A2C) and Generative Adversarial Imitation Learning (GAIL). Fast Fisher vector product TRPO.

a2c ppo trpo pytorch pytorch-rl fisher-vectors policy-gradient reinforcement-learning deep-reinforcement-learning proximal-policy-optimization generative-adversarial-network

Created 2017-10-17

100 commits to master branch, last one 4 years ago

btgym Kismuz

259

994

lgpl-3.0

99

Scalable, event-driven, deep-learning-friendly backtesting library

a3c unreal backtrader openai-gym tensorflow time-series hacktoberfest gym-environment policy-gradient algoritmic-trading quantitive-finance policy-optimisation statistical-arbitrage advantage-actor-critic reinforcement-learning algorithmic-trading-library deep-reinforcement-learning backtesting-trading-strategies

Created 2017-05-24

635 commits to master branch, last one 3 years ago

Hands-On-Reinforcement-Learning-With-Python sudharsan13296

324

848

unknown

43

Master Reinforcement and Deep Reinforcement Learning using OpenAI Gym and TensorFlow

Created 2018-06-11

44 commits to master branch, last one 4 years ago

RLSeq2Seq yaserkl

163

767

mit

27

Deep Reinforcement Learning For Sequence to Sequence Models

nlp actor-critic policy-gradient pointer-generator reinforcement-learning abstractive-text-summarization

Created 2018-05-24

181 commits to master branch, last one 5 years ago

awesome-monte-carlo-tree-search-papers benedekrozemberczki

74

674

cc0-1.0

29

A curated list of Monte Carlo tree search papers with implementations.

rl atari learning q-learning monte-carlo tree-search deep-learning deep-q-learning policy-gradient machine-learning policy-evaluation reinforcement-learning monte-carlo-tree-search machine-learning-algorithms reinforcement-learning-agent reinforcement-learning-algorithms

Created 2019-11-22

112 commits to master branch, last one about a year ago

rl_algorithms medipixel

64

512

mit

11

Structural implementation of RL key algorithms

dqn gym python3 pytorch deep-learning policy-gradient reinforcement-learning

Created 2018-12-10

184 commits to master branch, last one 2 years ago

deer VinF

123

484

other

50

DEEp Reinforcement learning framework

q-learning policy-gradient deep-reinforcement-learning

Created 2016-01-21

489 commits to master branch, last one 11 months ago

Deep-Reinforcement-Learning-With-Python sudharsan13296

137

410

unknown

10

Master classic RL, deep RL, distributional RL, inverse RL, and more using OpenAI Gym and TensorFlow with extensive Math

a2c a3c c51 dqn ppo sac td3 ddpg trpo double-dqn openai-gym q-learning actor-critic deep-learning policy-gradient bellman-equation reinforcement-learning deep-reinforcement-learning inverse-reinforcement-learning

Created 2020-10-02

23 commits to master branch, last one 4 years ago

lagom zuoxingdong

30

375

mit

15

lagom: A PyTorch infrastructure for rapid prototyping of reinforcement learning algorithms.

Created 2017-12-21

703 commits to master branch, last one 5 years ago

Reinforcement_Learning pythonlessons

155

375

mit

6

Reinforcement learning tutorials

a2c a3c dqn ppo d3qn ddqn ppo-agent dueling-dqn lunarlander bipedalwalker policy-gradient actor-critic-algorythm reinforcement-learning

Created 2020-01-13

84 commits to master branch, last one 2 years ago

DeepRL_Algorithms RITCHIEHuang

39

331

unknown

10

DeepRL algorithms implementation easy for understanding and reading with Pytorch and Tensorflow 2(DQN, REINFORCE, VPG, A2C, TRPO, PPO, DDPG, TD3, SAC)

dqn ppo td3 trpo mujoco pytorch-rl tensorflow2 reinforcement policygradient policy-gradient soft-actor-critic pytorch-implementation deep-reinforcement-learning reinforcement-learning-algorithms

Created 2019-07-30

24 commits to master branch, last one 3 years ago

Reinforcement-Learning-Papers Allenpandas

35

309

mit

12

📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

dqn aaai icml ijcai neurips rl-papers q-learning policy-gradient imitation-learning reinforcement-learning artificial-intelligence deep-reinforcement-learning meta-reinforcement-learning reinforcement-learning-paper reinforcement-learning-papers offline-reinforcement-learning multi-agent-reinforcement-learning reinforcement-learning-conferences hierarchical-reinforcement-learning reinforcement-learning-conferences-papers

Created 2023-01-05

117 commits to main branch, last one 10 months ago

MultiHopKG salesforce

80

309

bsd-3-clause

14

Multi-hop knowledge graph reasoning learned via policy gradient with reward shaping and action dropout

pytorch action-dropout reward-shaping knowledge-graph policy-gradient multi-hop-reasoning reinforcement-learning

Created 2018-09-26

33 commits to master branch, last one about a month ago

HandyRL DeNA

43

288

other

12

HandyRL is a handy and simple framework based on Python and PyTorch for distributed reinforcement learning that is applicable to your own environments.

games pytorch deep-learning policy-gradient machine-learning distributed-training reinforcement-learning

Created 2020-06-03

813 commits to master branch, last one about a month ago

deep-algotrading LiamConnell

75

236

mit

19

A resource for learning about deep learning techniques from regression to LSTM and Reinforcement Learning using financial data and the fitness functions of algorithmic trading

lstm tensorflow deep-learning neural-network policy-gradient reinforcement-learning

Created 2016-07-12

31 commits to master branch, last one 10 months ago

VRP_DRL_MHA Rintarooo

38

186

mit

2

"Attention, Learn to Solve Routing Problems!"[Kool+, 2019], Capacitated Vehicle Routing Problem solver

vrp pytorch reinforce tensorflow policy-gradient multi-head-attention deep-reinforcement-learning capacitated-vehicle-routing-problem

Created 2020-06-24

89 commits to master branch, last one 4 years ago

ReMax liziniu

13

181

unknown

2

Code for Paper (ReMax: A Simple, Efficient and Effective Reinforcement Learning Method for Aligning Large Language Models)

rlhf policy-gradient large-language-models reinforcement-learning

Created 2023-10-17

3 commits to master branch, last one about a year ago

episodic-transformer-memory-ppo MarcoMeter

22

174

mit

3

Clean baseline implementation of PPO using an episodic TransformerXL memory

ppo trxl gtrxl pomdp pytorch on-policy memory-gym transformer actor-critic transformer-xl episodic-memory policy-gradient gated-transformer-xl deep-reinforcement-learning proximal-policy-optimization

Created 2022-05-04

9 commits to main branch, last one 10 months ago

pytorch-learn-reinforcement-learning gordicaleksa

33

154

mit

2

A collection of various RL algorithms like policy gradients, DQN and PPO. The goal of this repo will be to make it a go-to resource for learning about RL. How to visualize, debug and solve RL problems...

rl dqn ppo python jupyter pytorch pytorch-dqn pytorch-ppo deep-learning deep-q-network policy-gradient pytorch-implementation reinforcement-learning pytorch-policy-gradient reinforcement-learning-algorithms

Created 2021-04-06

53 commits to main branch, last one 3 years ago

imitation_learning CherryPieSexy

15

145

unknown

5

PyTorch implementation of some reinforcement learning algorithms: A2C, PPO, Behavioral Cloning from Observation (BCO), GAIL.

a2c ppo gail pytorch gail-ppo ppo-algo ppo-pytorch deep-learning recurrent-ppo policy-gradient imitation-learning advantage-actor-critic reinforcement-learning deep-reinforcement-learning proximal-policy-optimization

Created 2020-05-04

89 commits to master branch, last one 3 years ago

Tutorial4RL Allenpandas

12

142

mit

5

Tutorial4RL: Tutorial for Reinforcement Learning. 强化学习入门教程.

a3c dqn ddpg sarsa tutorial qlearning rl-tutorial policy-gradient multi-agent-systems reinforcement-learning deep-reinforcement-learning inverse-reinforcement-learning reinforcementlearning-tutorial multi-agent-reinforcement-learning

Created 2023-01-07

16 commits to main branch, last one about a year ago

recurrent-ppo-truncated-bptt MarcoMeter

18

139

mit

3

Baseline implementation of recurrent PPO using truncated BPTT

gru ppo bptt lstm pomdp pytorch on-policy recurrent truncated recurrence actor-critic deep-learning policy-gradient recurrent-neural-networks deep-reinforcement-learning proximal-policy-optimization

Created 2021-06-07

13 commits to main branch, last one about a year ago

Deep-Reinforcement-Learning-CS285-Pytorch erfanMhi

11

137

mit

3

Solutions of assignments of Deep Reinforcement Learning course presented by the University of California, Berkeley (CS285) in Pytorch framework

mujoco python pytorch berkeley openai-gym deep-learning model-free-rl model-based-rl deep-q-learning neural-networks policy-gradient actor-critic-algorithm reinforcement-learning deep-reinforcement-learning

Created 2020-06-13

38 commits to master branch, last one 4 years ago