Search Results - RepositoryStats

258

2.3k

apache-2.0

33

SOTA low-bit LLM quantization (INT8/FP8/INT4/FP4/NF4) & sparsity; leading model compression techniques on TensorFlow, PyTorch, and ONNX Runtime

awq fp4 gptq int4 int8 pruning mxformat sparsity sparsegpt auto-tuning smoothquant quantization low-precision large-language-models knowledge-distillation post-training-quantization quantization-aware-training

Created 2020-07-21

3,709 commits to master branch, last one 3 days ago

micronet 666DZY666

478

2.2k

mit

41

micronet, a model compression and deploy lib. compression: 1、quantization: quantization-aware-training(QAT), High-Bit(>2b)(DoReFa/Quantization and Training of Neural Networks for Efficient Integer-Ari...

Created 2019-12-04

295 commits to master branch, last one 3 years ago

nncf openvinotoolkit

240

965

apache-2.0

31

Neural Network Compression Framework for enhanced OpenVINO™ inference

llm nlp bert onnx genai pruning pytorch openvino sparsity tensorflow compression quantization transformers deep-learning classification object-detection semantic-segmentation mixed-precision-training quantization-aware-training

Created 2020-05-13

2,345 commits to develop branch, last one a day ago

TinyNeuralNetwork alibaba

117

772

mit

21

TinyNeuralNetwork is an efficient and easy-to-use deep learning model compression framework.

pruning pytorch deep-learning model-converter model-compression deep-neural-networks post-training-quantization quantization-aware-training

Created 2021-11-02

821 commits to main branch, last one 17 days ago

YOLOv3v4-ModelCompression-MultidatasetTraining-Multibackbone SpursLipu

136

445

gpl-3.0

8

YOLO ModelCompression MultidatasetTraining

yolo pruning mobilenetv3 multidataset modelcompression object-detection quantization-aware-training

Created 2019-12-24

438 commits to master branch, last one 2 years ago

Sparsebit megvii-research

40

328

apache-2.0

12

A model compression and acceleration toolbox based on pytorch.

sparse pruning tensorrt quantization deep-learning post-training-quantization quantization-aware-training

Created 2022-07-21

134 commits to main branch, last one about a year ago

hls4ml-tutorial fastmachinelearning

139

311

unknown

21

Tutorial notebooks for hls4ml

fpga hls4ml pruning tutorial machine-learning quantization-aware-training

Created 2020-06-02

127 commits to main branch, last one 18 days ago

BitNet-Transformers Beomi

34

287

unknown

9

0️⃣1️⃣🤗 BitNet-Transformers: Huggingface Transformers Implementation of "BitNet: Scaling 1-bit Transformers for Large Language Models" in pytorch with Llama(2) Architecture

llm quantization transformers quantization-aware-training

Created 2023-10-19

18 commits to main branch, last one about a year ago