Search Results - RepositoryStats

2 results found Sort:

171

mit

Clean baseline implementation of PPO using an episodic TransformerXL memory

ppo trxl gtrxl pomdp pytorch on-policy memory-gym transformer actor-critic transformer-xl episodic-memory policy-gradient gated-transformer-xl deep-reinforcement-learning proximal-policy-optimization

Created 2022-05-04

9 commits to main branch, last one 9 months ago

mit

Challenging Memory-based Deep Reinforcement Learning Agents

gru lstm trxl gtrxl pomdp benchmark recurrence transformer transformer-xl gym-environment imperfect-information deep-reinforcement-learning

Created 2022-07-05

105 commits to main branch, last one 5 months ago