Search Results - RepositoryStats

IterComp YangLing0818

11

178

mit

2

[ICLR 2025] IterComp: Iterative Composition-Aware Feedback Learning from Model Gallery for Text-to-Image Generation

dpo rlhf text-to-image reward-modeling

Created 2024-10-09

17 commits to main branch, last one about a month ago

tasksource sileod

10

176

apache-2.0

3

Datasets collection and preprocessings framework for NLP extreme multitask learning

Created 2022-12-06

220 commits to main branch, last one 2 months ago

vector-inference VectorInstitute

10

55

mit

6

Efficient LLM inference on Slurm clusters using vLLM.

llm vlm vllm inference llm-inference text-embedding reward-modeling

Created 2024-03-06

474 commits to main branch, last one 15 days ago

RewardModelingBeyondBradleyTerry holarissun

3

45

mit

2

official implementation of ICLR'2025 paper: Rethinking Bradley-Terry Models in Preference-based Reward Modeling: Foundations, Theory, and Alternatives

rlhf reward llm-aligment llmalignment reward-models reward-modeling largelanguagemodels large-language-models inverse-reinforcement-learning

Created 2024-09-18

45 commits to main branch, last one 2 days ago