Search Results - RepositoryStats

834

3.7k

mit

64

PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) ...

Created 2017-08-22

274 commits to master branch, last one 3 years ago

nngeometry tfjgeorge

22

211

mit

6

{KFAC,EKFAC,Diagonal,Implicit} Fisher Matrices and finite width NTKs in PyTorch

fim ntk gram kfac ekfac k-fac ek-fac hessian pytorch tangent jacobian neural-tangent-kernel fisher-information-matrix

Created 2019-09-12

500 commits to master branch, last one 15 days ago

kfac-pytorch gpauloski

25

85

mit

3

Distributed K-FAC Preconditioner for PyTorch

kfac pytorch optimizer distributed deep-learning second-order-optimization

Created 2020-02-16

665 commits to main branch, last one 6 days ago

bayesian_lora MaximeRobeyns

5

29

apache-2.0

3

Bayesian Low-Rank Adaptation for Large Language Models

llm kfac laplace-approximation

Created 2024-01-19

41 commits to master branch, last one 9 months ago